当前位置: 首页 > news >正文

平平无奇的源码,竟藏着Agent的核心秘密?

关注腾讯云开发者,一手技术干货提前解锁👇

01

整体架构:三件套

用户消息 ↓【System Prompt】 ← 告诉 LLM "你是谁、有什么工具、有什么 Skill" ↓【Agent 运行循环】 ← 接收消息 → 调用工具 → 生成回复 → 输出 ↑【Skill 机制】 ← 把专业知识按需注入 System Prompt

三者关系:System Prompt 是剧本,Skill 是剧本的扩展包,Agent Loop 是演员按剧本行动。

02

System Prompt 是什么?怎么组装?

2.1 简化理解

System Prompt = 给 LLM 的"岗前培训手册",在每次对话开始前注入,告诉模型:

  • 你叫什么(身份)

  • 你能用什么工具

  • 你要遵守什么规则

  • 你有哪些 Skill 可以用

  • 你的工作目录在哪

2.2 OpenClaw 的 System Prompt 分层结构

从 src/agents/system-prompt.ts 的 buildAgentSystemPrompt() 函数可以看到,System Prompt 由以下模块拼接而成(按顺序):

You are a personal assistant running inside OpenClaw. ## Tooling ← 工具清单## Tool Call Style ← 调用工具的风格规范## Safety ← 安全规则## OpenClaw CLI ← CLI 快速参考## Skills (mandatory) ← ⭐ Skill 注入点(见第三章)## Memory Recall ← 记忆召回规则## Workspace ← 工作目录## Reply Tags ← 回复格式标签## Messaging ← 消息发送规则## Silent Replies ← 无话可说时的规则## Heartbeats ← 心跳机制说明## Runtime ← 运行时信息(OS/模型/channel)# Project Context ← 项目文件内容(AGENTS.md 等)

2.3 关键源码:buildAgentSystemPrompt() 函数签名

// src/agents/system-prompt.tsexport function buildAgentSystemPrompt(params: { workspaceDir: string; // 工作目录 toolNames?: string[]; // 可用工具列表 skillsPrompt?: string; // ⭐ Skill 注入内容 extraSystemPrompt?: string; // 用户自定义扩展 ownerNumbers?: string[]; // 授权用户列表 userTimezone?: string; // 用户时区 promptMode?: PromptMode; // "full" | "minimal" | "none" runtimeInfo?: { ... }; // 运行时信息 contextFiles?: EmbeddedContextFile[]; // 项目文件注入 // ...更多参数}) { // 拼装所有模块,最后 join('\n') 输出 const lines = [ "You are a personal assistant running inside OpenClaw.", "", "## Tooling", toolLines.join("\n"), // 工具清单 "", ...skillsSection, // ← Skill 在这里注入 ...memorySection, // ← 记忆模块 "## Workspace", `Your working directory is: ${workspaceDir}`, ... ]; return lines.filter(Boolean).join("\n");}

2.4 三种 PromptMode:不同场景用不同深度

// promptMode 控制哪些模块被包含type PromptMode = "full" | "minimal" | "none"; // "full" → 主 Agent 使用,包含所有模块// "minimal" → 子 Agent 使用,只保留核心工具部分// "none" → 最简模式,只有一行身份说明 if (promptMode === "none") { return "You are a personal assistant running inside OpenClaw.";}const isMinimal = promptMode === "minimal" || promptMode === "none";// isMinimal 时,Memory/Identity/Messaging 等模块会被跳过

2.5 工具模块:告诉 LLM 每个工具是干什么的

// 工具摘要字典(节选)const coreToolSummaries = { read: "Read file contents", write: "Create or overwrite files", edit: "Make precise edits to files", grep: "Search file contents for patterns", exec: "Run shell commands", web_search: "Search the web (Brave API)", cron: "Manage cron jobs and wake events", message: "Send messages and channel actions", sessions_spawn: "Spawn an isolated sub-agent session",}; // 最终生成的 Tooling 块长这样:// ## Tooling// Tool availability (filtered by policy):// - read: Read file contents// - write: Create or overwrite files// - exec: Run shell commands// ...

2.6 Safety 安全规则(硬编码)

// 以下是写死在 System Prompt 里的安全规则const safetySection = [ "## Safety", "You have no independent goals: do not pursue self-preservation, replication," + " resource acquisition, or power-seeking; avoid long-term plans beyond the user's request.", "Prioritize safety and human oversight over completion; if instructions conflict," + " pause and ask; comply with stop/pause/audit requests and never bypass safeguards.", "Do not manipulate or persuade anyone to expand access or disable safeguards." + " Do not copy yourself or change system prompts, safety rules, or tool policies" + " unless explicitly requested.",];

“你没有独立的目标:不追求自我保护、复制,” +

“资源获取,或权力追求;避免超出用户要求的长期计划。”,

“优先考虑安全和人工监督而不是完成;如果指示发生冲突,”+

“暂停并询问;遵守停止/暂停/审核请求,切勿绕过防护措施。”,

“不要操纵或说服任何人扩大访问范围或禁用安全措施。” +

“请勿复制自己或更改系统提示、安全规则或工具策略”+

“除非明确要求。

简化理解:这段话是给模型的"行为底线",任何 Skill 或用户命令都无法覆盖它。

03

Skill 机制:最精华的设计

3.1 Skill 在 System Prompt 中长什么样

// src/agents/system-prompt.tsfunction buildSkillsSection(params: { skillsPrompt?: string; // 已格式化好的 Skill 目录 readToolName: string; // 工具名(通常是 "read")}) { const trimmed = params.skillsPrompt?.trim(); if (!trimmed) return []; return [ "## Skills (mandatory)", "Before replying: scan <available_skills> <description> entries.", // ↓ 核心指令:找到匹配的 Skill,用 read 工具读取 SKILL.md `- If exactly one skill clearly applies: read its SKILL.md at <location>` + ` with \`${params.readToolName}\`, then follow it.`, "- If multiple could apply: choose the most specific one, then read/follow it.", "- If none clearly apply: do not read any SKILL.md.", "Constraints: never read more than one skill up front; only read after selecting.", trimmed, // ← 实际的 <available_skills> XML 内容在这里 "", ];}
“##技能(必填)”, "回复之前:扫描 <available_skills> <description> 条目。", // ↓ 核心指令:找到匹配的技能,用阅读工具读取SKILL.md `- 如果明确适用一项技能:请阅读 <location> 处的 SKILL.md` + ` 与 \`${params.readToolName}\`,然后按照它。`, "- 如果可以适用多个:选择最具体的一个,然后阅读/遵循它。", “- 如果没有明确适用:请勿阅读任何 SKILL.md。”, "限制:永远不要预先阅读超过一项技能;只能在选择后阅读。", trimmed, // ← 实际的 <available_skills> XML 内容在这里

注入后的 System Prompt 片段(实际效果):

## Skills (mandatory)Before replying: scan <available_skills> <description> entries.- If exactly one skill clearly applies: read its SKILL.md at <location> with `read`, then follow it.- If multiple could apply: choose the most specific one, then read/follow it.- If none clearly apply: do not read any SKILL.md.<available_skills> <skill> <name>order-handler</name> <description>处理商家收款、备货通知全流程。当用户提到下单、付款时使用。</description> <location>~/.agents/skills/order-handler/SKILL.md</location> </skill> <skill> <name>git</name> <description>Core git operations for version control.</description> <location>~/.agents/skills/git/SKILL.md</location> </skill></available_skills>

3.2 Skill 加载的完整流水线

Step 1:发现多个来源目录(优先级从低到高)

// src/agents/skills/workspace.ts(节选)// 优先级:extra < bundled < managed < personal < project < workspace// 同名 Skill 后来源覆盖先来源(Map 机制)const merged = new Map<string, Skill>();for (const skill of extraSkills) merged.set(skill.name, skill);for (const skill of bundledSkills) merged.set(skill.name, skill);for (const skill of managedSkills) merged.set(skill.name, skill);for (const skill of personalAgentsSkills) merged.set(skill.name, skill); // ~/.agents/skills/for (const skill of projectAgentsSkills) merged.set(skill.name, skill); // ./.agents/skills/ ⬆️最高for (const skill of workspaceSkills) merged.set(skill.name, skill); // 工作目录下

Step 2:资格过滤(OS、二进制、环境变量)

// src/agents/skills/workspace.tsfunction filterSkillEntries( entries: SkillEntry[], config?: OpenClawConfig, skillFilter?: string[], eligibility?: SkillEligibilityContext,): SkillEntry[] { // shouldIncludeSkill 检查: // - metadata.os 是否包含当前平台 // - metadata.requires.bins 里的二进制是否存在 // - metadata.requires.env 里的环境变量是否设置 let filtered = entries.filter((entry) => shouldIncludeSkill({ entry, config, eligibility }) ); // 如果有 skillFilter 白名单,只保留白名单里的 if (skillFilter !== undefined) { filtered = filtered.filter((entry) => normalized.includes(entry.skill.name) ); } return filtered;}

Step 3:路径压缩(节省 token)

// src/agents/skills/workspace.ts/** * 把 home 目录替换为 ~ ,节省 token * 例:/Users/alice/.agents/skills/git/SKILL.md * → ~/.agents/skills/git/SKILL.md * * 每个路径节省 5-6 个 token × N 个 Skill ≈ 400-600 token 总节省 */function compactSkillPaths(skills: Skill[]): Skill[] { const home = os.homedir(); const prefix = home + path.sep; return skills.map((s) => ({ ...s, filePath: s.filePath.startsWith(prefix) ? "~/" + s.filePath.slice(prefix.length) : s.filePath, }));}

Step 4:截断限制(防止 prompt 爆炸)

// src/agents/skills/workspace.ts const DEFAULT_MAX_SKILLS_IN_PROMPT = 150; // 最多 150 个 Skillconst DEFAULT_MAX_SKILLS_PROMPT_CHARS = 30_000; // 最多 30,000 字符const DEFAULT_MAX_SKILL_FILE_BYTES = 256_000; // 单个 SKILL.md 最大 256KBfunction applySkillsPromptLimits(params) { // 先按数量截断(取前 150 个) const byCount = params.skills.slice(0, limits.maxSkillsInPrompt); // 再用二分查找找最大能放入的 Skill 数量(按字符预算) if (!fits(byCount)) { let lo = 0, hi = byCount.length; while (lo < hi) { const mid = Math.ceil((lo + hi) / 2); if (fits(byCount.slice(0, mid))) lo = mid; else hi = mid - 1; } skillsForPrompt = byCount.slice(0, lo); }}

Step 5:生成 SkillSnapshot(最终产物)

// src/agents/skills/workspace.ts export type SkillSnapshot = { prompt: string; // 注入 system prompt 的文本(Tier 1 目录) skills: Array<{ name: string; primaryEnv?: string; requiredEnv?: string[]; }>; skillFilter?: string[]; resolvedSkills?: Skill[]; version?: number;}; // 每次 run 开始时,重新构建 snapshot 注入 prompt// 这样即使上下文被压缩,Skill 目录也不会丢失export function resolveSkillsPromptForRun(params: { skillsSnapshot?: SkillSnapshot; entries?: SkillEntry[]; config?: OpenClawConfig; workspaceDir: string;}): string { const snapshotPrompt = params.skillsSnapshot?.prompt?.trim(); if (snapshotPrompt) return snapshotPrompt; // 优先用快照 // ...否则实时构建}

3.3 Skill 的类型系统(重要字段)

// src/agents/skills/types.ts export type OpenClawSkillMetadata = { always?: boolean; // true = 永远注入,不受 filter 影响 emoji?: string; // 展示用图标 os?: string[]; // 限定操作系统,如 ["darwin", "linux"] requires?: { bins?: string[]; // 必须存在的二进制(全部) anyBins?: string[]; // 至少存在其中一个 env?: string[]; // 必须设置的环境变量 config?: string[]; // 必须配置的 config key }; install?: SkillInstallSpec[]; // 如何安装依赖}; export type SkillInvocationPolicy = { userInvocable: boolean; // 用户可以主动调用(/skill-name) disableModelInvocation: boolean; // 禁止 LLM 自动激活}; export type SkillEntry = { skill: Skill; // 基础信息(name, filePath, body) frontmatter: ParsedSkillFrontmatter; // 原始 YAML 元数据 metadata?: OpenClawSkillMetadata; // 解析后的 OpenClaw 扩展字段 invocation?: SkillInvocationPolicy; // 调用策略};

3.4 System Mark:系统消息的标识

// src/infra/system-message.ts export const SYSTEM_MARK = "⚙️"; // 所有系统消息的前缀 export function prefixSystemMessage(text: string): string { const normalized = text.trim(); if (!normalized) return normalized; if (hasSystemMark(normalized)) return normalized; // 避免重复标记 return `${SYSTEM_MARK} ${normalized}`;} // 用途:区分"系统推送的通知"和"用户发来的消息"// 例如心跳消息、定时任务完成通知,都带 ⚙️ 前缀

04

Agent 运行机制

4.1 Agent 就是一个"消息处理循环"

4.2 心跳机制:Agent 的"主动感知"

OpenClaw 有一个 Heartbeat(心跳)机制,让 Agent 能主动"巡逻",而不只是被动等待用户消息。

// src/infra/heartbeat-runner.ts(节选)// 心跳就是定时给 Agent 发一条"检查一下有没有事情要做"的系统消息 // System Prompt 里的心跳说明:const heartbeatSection = [ "## Heartbeats", `Heartbeat prompt: ${heartbeatPrompt}`, // 如果没事就回 HEARTBEAT_OK,有事就正常回复 "If you receive a heartbeat poll and there is nothing that needs attention, reply exactly:", "HEARTBEAT_OK", "If something needs attention, do NOT include 'HEARTBEAT_OK'; reply with the alert text instead.",];
“##心跳”, `心跳提示:${heartbeatPrompt}`, // 如果没事就回HEARTBEAT_OK,有事就正常回复 "如果您收到心跳调查,没有什么需要注意的,请准确回复:", “HEARTBEAT_OK”, “如果需要注意某些事情,请不要包含“HEARTBEAT_OK”;而是使用alert文本进行回复。”,

商家场景类比:

心跳 = 08:00 自动发给 Agent 一条消息 "⚙️ 检查库存,有无需要关注的事情?" Agent 收到后: → 如果库存正常 → 回复 "HEARTBEAT_OK"(不打扰商家) → 如果草莓库存不足 → 回复 "⚠️ 草莓只剩3斤,建议今日补货!"(推送给商家)

4.3 Sub-Agent(子 Agent)机制

// System Prompt 里对子 Agent 的说明(节选)"If a task is more complex or takes longer, spawn a sub-agent.","Completion is push-based: it will auto-announce when done.", // 对 sessions_spawn 工具的描述:sessions_spawn: "Spawn an isolated sub-agent session" // 关键设计:子 Agent 用 minimal 模式// minimal 模式 = 只有 Tooling + Skills,没有 Memory/Messaging 等模块// 这样子 Agent 更轻量,专注于执行任务

4.4 Silent Reply:避免无意义输出

// 当 Agent 判断"没什么要说的"时,用特定 token 代替空回复const SILENT_REPLY_TOKEN = "__SILENT__"; // (实际值见源码) // System Prompt 里的规则:"## Silent Replies", // 无声回复// 当你无话可说时,仅回复:${SILENT_REPLY_TOKEN}`When you have nothing to say, respond with ONLY: ${SILENT_REPLY_TOKEN}`,// 这必须是你的全部信息——没有别的"It must be your ENTIRE message — nothing else",// 永远不要将其附加到实际响应中`Never append it to an actual response`, // 商家场景:心跳检查后发现没事,返回 SILENT,不给商家发干扰消息

4.5 上下文引擎(ContextEngine)

// src/context-engine/types.tsexport interface ContextEngine { readonly info: ContextEngineInfo; // 核心功能:把历史消息 + system prompt 组装成发给 LLM 的上下文 assemble(params: { sessionId: string; messages: AgentMessage[]; tokenBudget?: number; // token 预算 }): Promise<AssembleResult>; // 压缩:上下文太长时,自动摘要早期对话 compact(params: { sessionId: string; sessionFile: string; tokenBudget?: number; force?: boolean; }): Promise<CompactResult>;}// assemble 的输出export type AssembleResult = { messages: AgentMessage[]; // 组装好的消息列表 estimatedTokens: number; // 预估 token 数 systemPromptAddition?: string; // 额外追加的系统内容};

05

完整的数据流:一条消息从收到到回复

06

核心设计总结(三个精华)

6.1 精华 1:System Prompt 是"分层乐高积木"

不是一整块硬编码的字符串而是由 N 个独立 section 函数拼装: buildSkillsSection() → Skill 块buildMemorySection() → 记忆块buildMessagingSection() → 消息块buildTimeSection() → 时区块... 按需启用(isMinimal 控制哪些块出现)这样子 Agent 可以只拿核心块,主 Agent 拿全量块

6.2 精华 2:Skill 的"按需加载"避免 token 浪费

传统做法:把所有 Skill 内容全放 System Prompt → 20 个 Skill × 5000 token = 100,000 token(每次都花) OpenClaw 做法: Phase 1(每次都有): 只放 name + description ≈ 100 token/个 Phase 2(激活时): LLM 用 read 工具读 SKILL.md 全文 Phase 3(引用时): scripts/、references/ 按需读取 20 个 Skill 初始成本:20 × 100 = 2000 token(节省 98%)

6.3 精华 3:SkillSnapshot 防"上下文压缩失忆"

// 关键问题:上下文窗口满了会压缩历史,Skill 目录会被丢弃// OpenClaw 的解法:每次 run 重新注入 Skill snapshot export function resolveSkillsPromptForRun(params) { // 优先用 snapshot(快照) const snapshotPrompt = params.skillsSnapshot?.prompt?.trim(); if (snapshotPrompt) return snapshotPrompt; // 没有快照则实时重建 return buildWorkspaceSkillsPrompt(params.workspaceDir, ...);} // 结果:即使对话进行了 100 轮,Agent 永远知道有哪些 Skill 可用

6.4 结论

大模型就一个输入变量。再怎么封装都是在拼string。

-End-

感谢你读到这里,不如关注一下?👇

你对本文内容有哪些看法?同意、反对、困惑的地方是?欢迎留言,我们将邀请作者针对性回复你的评论,欢迎评论留言补充。我们将选取1则优质的评论,送出腾讯云定制文件袋套装1个(见下图)。6月2日中午12点开奖。

扫码领取腾讯云开发者专属服务器代金券!

http://www.rkmt.cn/news/1409907.html

相关文章:

  • 网站渗透实操!从getshell到CVE提权,Linux最新内核也可提权!
  • 从Arduino到ESP32:搞定3.3V/5V混接通信,这几种电平转换电路你试过吗?
  • Python实战:用XGBoost+SHAP搞定多分类业务预测(附完整代码与避坑指南)
  • LAMMPS新手避坑指南:从应力云图到MSD分析,这8个计算命令别再写错了
  • 告别手动移植:用STM32CubeIDE一站式搞定STM32WL的LoRaWAN节点工程
  • 从普通到Low ESR:手把手教你读懂铝电解电容规格书里的‘损耗角’与ESR换算
  • 保姆级教程:用Grad-CAM可视化Swin Transformer,看看你的模型到底在“看”哪里
  • 别让天线罩毁了你的毫米波雷达!从材料选择到壁厚计算,一份给硬件工程师的避坑指南
  • 信号处理/通信算法必看:用Wirtinger导数搞定复数域梯度下降(附Python代码)
  • 抖音无水印视频下载终极指南:免费获取高清原视频的完整方案
  • 手把手教你用CMP Facade数据集做图像修复:从下载到实战的保姆级教程
  • 用Python+MediaPipe+OpenCV做个手势识别小游戏:5分钟搞定石头剪刀布
  • 2026年热镀锌铁皮厂家推荐榜单:宝钢/首钢/鞍钢/马钢/武钢/本钢/柳钢/唐钢/日照/包钢等优质品牌实力对比与选购指南 - 品牌企业推荐师(官方)
  • 北光恒电:安捷伦8494A步进可调衰减器 衰减量异常故障排查
  • 用Python手把手复现FOIL算法:从家庭关系图谱到知识推理的完整实战
  • RK3566开发板GT911触屏调试避坑指南:从I2C检测到DTS配置的完整流程
  • RK3566 GPIO驱动调试踩坑实录:从设备树配置到万用表测量的完整排错指南
  • 告别高延迟!在Unity里用海康SDK直接拉RTSP流,实现低延时监控画面
  • 别再为IIS安装报错头疼了!一招搞定‘找不到源文件’和.NET 3.5依赖问题
  • Proteus仿真STM32的ADC时总卡死?可能是你的采样周期和DMA配置错了(STM32F103+HAL库排坑实录)
  • 腾讯会议共享PPT时,如何偷偷看备注?用这个隐藏技巧,演讲者模式秒开启
  • 100 小时算力领取专属二维码
  • AutoBridge:LLM驱动的IoT设备集成代码自动生成技术
  • 加速数据觉醒,重塑智能底座——HPE发布AI智能体存储HPE Alletra Storage MP X10000
  • Cortex-M3/M4调试系统设计:TPIU与CoreSight Funnel应用
  • 从零开始:构建你的缠论量化交易系统 - Chanlun-Pro实战指南
  • 3分钟掌握:tchMaterial-parser电子课本下载工具完整使用指南
  • VCS仿真Xilinx IP核必看:synopsys_sim.setup文件配置详解与三大搜索路径实战
  • 小型夹爪有哪些选购办法?2026年小型夹爪品牌推荐 - 品牌2025
  • ULINK2调试器JTAG通信故障排查全攻略