本文通过8个关键问题,对应Agent技术栈的8个架构层,帮助开发者理清Agent开发思路。文章强调场景驱动而非技术驱动,并从应用层、AI工程层、工作流编排层、Agent框架层、认知层、可观测层、Memory/RAG层以及模型运行层,详细阐述了每个层次的技术选项和决策要点,旨在帮助开发者构建高效、稳定的Agent系统。
从 8 个问题看懂 Agent 技术栈选型,一张图覆盖 8 层完整架构
用 AI 做 Agent 的人都知道这个场景:跟团队说要做一个"智能客服",大家热火朝天开始选模型、调 Prompt、搭框架。两个月过去,Demo 跑通了——然后发现:对话上下文丢了、工具调用不稳定、出错了不知道怎么排查、换个场景又要从头搭。
这不是模型的能力问题,是架构缺失。就像盖房子不打地基就直接砌墙——不是砖的问题,是图纸的问题。
这篇文章不跟你讲抽象的分层理论,而是用8 个问题,对应 Agent 技术栈的8 个架构层。每个问题都是你开发 Agent 时必须做的决策,每个决策背后都有一组成熟的技术选项。
问题 1:你的 Agent 要解决什么业务问题?
对应:应用层(Application Layer)
没想清楚:技术驱动做产品。看到别人做 AI Coding 你也做,看到别人做 AI 客服你也跟。结果是做完没人用,或者用起来发现场景根本不匹配——你的用户不需要一个会聊天的机器人,他们需要一个能查订单、能退款的工具。
想清楚了:场景驱动选技术。先定义清楚:用户是谁?解决什么痛点?成功标准是什么?Agent 的终点不是模型,是产品。
对比:技术驱动 → 场景驱动
技术选项(按场景划分):
| 场景 | 代表产品 |
|---|---|
| AI Coding | Devin, Cursor, Claude Code |
| AI 客服 | 自建 (LangGraph + RAG) |
| AI 数据分析 | 自建 (Text-to-SQL) |
| AI 搜索 | Perplexity, 自建 RAG |
| AI 知识库 | Notion AI, 自建管道 |
| AI 办公助手 | ChatGPT, 自建工作流 |
问题 2:怎么让 Agent 不"裸奔"?
对应:AI 工程层(AI Engineering Layer)
没想清楚:Prompt 直接写死在代码里,上线后 Agent 开始"行为漂移"——同一个问题有时答对有时答错,团队无法协作,没有测试,没有版本管理,不敢改 Prompt。每次修改都靠"试"。
想清楚了:用软件工程的思维管 AI:
- •Spec-Driven Development:像写 PRD 一样定义 Agent 的角色、工具、约束、输出格式
- •PromptOps:Prompt 版本管理、发布、回滚、A/B 测试
- •Review Gate:Agent 输出必须经过审批/校验才能执行重要操作
- •Multi-Agent 协作规范:Planner → Researcher → Coder → Reviewer 分工明确
对比:AI 原型 → AI 产品
技术选项:
| 能力 | 实现方式 |
|---|---|
| Spec-Driven | 自建规范流程 |
| PromptOps | LangSmith Hub, Git 版本管理 |
| Review Gate | Human-in-the-Loop 流程 |
| 评估体系 | LangSmith Evaluation, 自建测试集 |
问题 3:Agent 的执行流程怎么编排?
对应:工作流编排层(Workflow / Orchestration Layer)
没想清楚:Agent 的执行顺序全靠 LLM 的"自由意志"。出错不会重试,流程走到一半卡住了没人知道,一个子任务失败整个流程崩溃。线上跑起来像在"赌"——这次能成功吗?
想清楚了:用 DAG(有向无环图)或状态机来定义流程。条件路由、并行执行、重试/恢复、Human-in-the-Loop 全在流程层面管理,LLM 只负责它擅长的推理决策,流程的确定性交给编排层。
对比:不可控单步执行 → 可控 DAG 工作流
技术选项:
| 框架 | 适用场景 | 特点 |
|---|---|---|
| LangGraph | AI Agent 工作流 | 原生 StateGraph、条件路由、多 Agent |
| Temporal | 通用微服务编排 | 强可靠性、长期运行工作流 |
| Prefect | 数据管道 | Python 原生、丰富的重试策略 |
| Airflow | 批处理调度 | 生态最成熟、适合定时任务 |
| Dagster | 数据资产编排 | 可观测性强 |
| CrewAI Flow | 多 Agent 流程 | 与 CrewAI 深度集成 |
问题 4:用什么框架搭建 Agent 主体?
对应:Agent 框架层(Agent Framework Layer)
没想清楚:从零开始写 Agent 逻辑——Prompt 拼接、Tool Calling 循环、输出解析、记忆管理全自己实现。一个简单功能写几百行胶水代码,换个模型就要重写一半。
想清楚了:站在巨人的肩膀上。选择一个成熟的 Agent 框架作为"AI 的 Spring Boot",它帮你搞定 Prompt 管理、工具调用、执行器、记忆接口、输出解析这些基础设施。
对比:从零造轮子 → 选成熟的 Agent SDK
技术选项:
| 框架 | 特点 | 适合 |
|---|---|---|
| LangChain | 生态最大、集成最全 | 快速原型到生产 |
| LlamaIndex | 数据/检索能力强 | RAG 为主的场景 |
| AutoGen | 多 Agent 对话 | 多 Agent 协作 |
| CrewAI | 角色化 Agent 团队 | 模拟团队分工 |
| Semantic Kernel | 微软出品、.NET 友好 | 企业 .NET 环境 |
| DSPy | 自动优化 Prompt | 精细控制推理逻辑 |
| Haystack | 端到端 NLP 管道 | 搜索/RAG 场景 |
问题 5:怎么让 Agent 学会"思考"?
对应:Agent 认知层(Agent Theory / Cognitive Layer)
没想清楚:Agent 接到复杂问题就直接回答,说"我不知道"或者瞎编一个答案。不会拆解问题、不会反思自己的答案、不会多路径推理。就像一个刚毕业的实习生——态度好但能力不足。
想清楚了:给 Agent 装上"思维模式"。让它在回答问题之前先想想、在调用工具之前先计划、在给出答案之前先反思。
对比:直给式回答 → 结构化推理
核心技术模式:
| 模式 | 核心思想 | 适用场景 |
|---|---|---|
| CoT(Chain of Thought) | 逐步推理 | 数学、逻辑问题 |
| ReAct | 推理 + 工具调用交替 | 需要查信息的复杂问题 |
| ToT(Tree of Thoughts) | 多路径并行探索 | 开放创作、规划 |
| Reflexion | 自我批评 + 修正 | 编码、写作等迭代任务 |
| Plan-and-Execute | 先规划再执行 | 多步骤复杂任务 |
| Multi-Agent 认知 | 多个 Agent 辩论/协作 | 需要多视角的问题 |
问题 6:Agent 上线了怎么监控和评估?
对应:可观测层(Observability Layer)
没想清楚:Agent 上线后是一个"黑盒"。用户说"出错了",你翻日志也不知道是模型抽风、工具调用失败、还是 Prompt 写错了。每次排查都要靠"猜",更别提做效果评估和成本控制了。
想清楚了:给 Agent 装上"仪表盘"。从 Tracing、Prompt 日志、Token 消耗、延迟监控、到效果评估和回归测试,全部可观测、可追溯、可分析。
对比:黑盒盲猜 → 全链路可观测
技术选项:
| 平台 | 特点 |
|---|---|
| LangSmith | LangChain 原生集成、Tracing + 评估 |
| LangFuse | 开源友好、成本低、自部署 |
| Helicone | 轻量代理、API 级别监控 |
| Phoenix (Arize) | 开源 LLM 可观测 |
| Weights & Biases | 实验追踪 + Prompt 管理 |
问题 7:Agent 怎么记住用户和上下文?
对应:Memory / RAG 层
没想清楚:每次对话 Agent 都像"失忆"一样——上次聊到哪了?用户偏好是什么?历史订单信息呢?全不记得。更别说从知识库里检索公司内部文档了。
想清楚了:构建分层的记忆系统:
- •会话记忆:短期对话上下文
- •向量检索(RAG):从知识库找到相关信息
- •混合搜索:关键词 + 语义双路召回
- •知识图谱:实体关系存储与推理
- •缓存:常用查询加速、降低延迟
对比:一次性聊天机器人 → 有持久记忆的 AI
技术选项:
| 技术 | 用途 | 代表产品 |
|---|---|---|
| 向量数据库 | 语义检索 | Pinecone, Milvus, Weaviate, Chroma, FAISS |
| 图数据库 | 关系存储与推理 | Neo4j |
| 混合搜索 | 关键词 + 语义召回 | Elasticsearch + 向量插件 |
| 会话缓存 | 短期记忆加速 | Redis |
| 知识图谱 | 结构化知识推理 | Neo4j, Amazon Neptune |
问题 8:模型底座怎么选、怎么部署?
对应:模型运行层(Model Runtime Layer)
没想清楚:凭感觉选模型——GPT 最贵但最好、开源最便宜但效果差。没有合理的选型策略,导致要么成本爆炸、要么效果不行。部署也是随便拉个容器跑,推理速度慢、不稳定、GPU 利用率低。
想清楚了:根据场景选模型、根据规模做部署:
- •简单任务(分类、提取)→ 小模型省钱
- •复杂推理(代码生成、深度分析)→ 大模型出活
- •高频低延迟→ 自建推理引擎(vLLM / TensorRT-LLM)
- •低频原型→ API 调用最省事
对比:凭感觉选型 → 按场景分层
技术选项:
| 类型 | 选项 |
|---|---|
| 闭源 API | OpenAI, Anthropic, Gemini, Grok |
| 开源模型 | Llama, Qwen, DeepSeek |
| 推理引擎 | vLLM, TensorRT-LLM, SGLang, Ollama |
| 部署平台 | Kubernetes, GPU 云平台 |
结语
8 个问题,8 个架构层:
| # | 问题 | 架构层 | 核心对比 |
|---|---|---|---|
| 1 | 解决什么业务? | 应用层 | 技术驱动 → 场景驱动 |
| 2 | 怎么不裸奔? | AI 工程层 | AI 原型 → AI 产品 |
| 3 | 流程怎么编排? | 工作流层 | 单步执行 → DAG 控制 |
| 4 | 用什么框架搭? | 框架层 | 造轮子 → Agent SDK |
| 5 | 怎么学会思考? | 认知层 | 直给回答 → 结构化推理 |
| 6 | 上线怎么监控? | 可观测层 | 黑盒盲猜 → 全链路可观测 |
| 7 | 怎么记住东西? | Memory/RAG | 失忆聊天 → 持久记忆 |
| 8 | 模型怎么选? | 运行层 | 凭感觉 → 按场景分层 |
每次做 Agent 项目,拿这 8 个问题过一遍,你的架构自然就有了。不用纠结于技术名词和热点,回答好每个问题,技术选型就是顺理成章的事。
Agent 的竞争,最终不是模型竞争,而是系统架构竞争。
传统产品经理,正在成为下个被淘汰的“传统岗位”。
过去画原型、写 PRD、跟进度的“传统技能包”,在AI时代正迅速贬值。63% 的企业转型做 AI 产品!当下的问题不再是“要不要学 AI ”,而是“如何构建 AI 产品”。
前段时间还跟字节、腾讯的资深 AI 产品经理沟通,他们反馈:在大量招人,只要有 AI 相关的项目经验,基本都能拿到面试机会,而且领导很舍得给钱,涨薪 40-60% 很正常!
01
接下来的产品人,得卷AI能力了!
如今AI大火,行业极速发展的背后,懂AI 产品人才却严重稀缺。这不是要你转技术岗,而是要掌握构建 AI 产品的核心方法:
- 如何将你的领域知识,转化为 AI 产品的核心竞争力?
- 如何用 AI 技术实现你的产品需求?
- 如何设计真正懂用户的 AI 交互体验?
- ……
懂AI,就是产品经理的“救命稻草”!
风口之下,与其焦虑被行业淘汰
不如先人一步享受AI技术带来的红利!
我把AI产品经理的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
(不限年龄!不限岗位!没有代码基础也能学!)
🎁现在扫码,完课还送:
《AI产品面试题库》《AI大模型应用案例集》
02
掌握技术+实战,快速转型!
想成为一名卓越的AI大模型产品经理,需要从技术、到项目实战的全方位转型指南!
**1)**AI产品应用原理解析,产品经理也能听懂!
对于产品经理来说,如果你不懂技术,做不了业务和AI大模型技术衔接、定义不了数据需求,是没法完整的落地一个产品的!
本次课程,专门面向产品经理人群,解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理!解析AI产品应用技术,积累大模型能力!简单易懂,不需要会代码,小白也能掌握!
- 大模型微调:掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。学习如何利用领域数据(如制造、医药、金融等)进行模型定制
- AI Agent智能体搭建:学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手产品(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)
2)超全行业案例解析!
课程详细讲解现阶段,大模型在各个行业和领域的应用现状!包括:零售与电商、教育、医疗、泛娱乐、法律等等10大行业!
详细讲解案例的思路、应用场景,以及背后的技术原理、核心技术!揭秘各个行业、场景的真实现状,和未来产品的发展与机遇!
可以说,讲解完一个案例,就能积累一个AI产品实践的经验!
课程中所涉及到的实战项目,都可以直接在自己的工作中使用,让自己的产品/项目有可借鉴的成功案例!
3)AI产品经理求职专项辅导
课程中会系统的帮助大家拆解字节、腾讯、百度等大厂AI PM岗位JD关键词,掌握AI PM高频面试题型与回答框架;展示 AI 相关能力的关键技巧:Prompt设计、模型评估、A/B测试、成本意识、与算法/工程协作经验;
- To B类AI产品经理:突出“行业理解 + 技术落地 + 商业闭环”能力的简历结构设计,展示项目成果;从客户需求洞察到技术方案设计,展现端到产品思维;如何评估To B AI产品的可行性、客户付费意愿与实施成本
- To C类AI产品经理:拆解头部公司岗位JD,将过往尽力转化为AI产品叙事逻辑;从行业趋势、产品设计题、案例分析&数据分析题、技术理解边界等全流程辅导面试;避免无效海投、锁定最适合的AI产品岗位;
03
本次课程,全程直播讲解,能直接对话大佬和专业助教,不懂就问,超详细的案例,小白也能轻松get!
完课后,还赠送《AI产品经理面试题库》、《AI大模型应用案例集》!不断更新中……
适合人群:
- 想转型AI产品经理、AI项目管理专家、AI产品解决方案等岗位
- 想进行AI产品创业的创业者
- 想成为制作AI产品的程序员
- 想利用AI解决企业问题的管理岗
- 想在AI方向寻找就业方向的毕业生
- AI方向前景广阔、待遇好!
目前,很多产品人已经通过完整学习拿到大厂高薪offer,收入嗷嗷涨!
我把AI产品经理的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~