基于 LangGraph 的领域智能体(Agent)架构实践与落地参考
答案取决于你的任务有多复杂。
如果你只做简单问答,Dense RAG 配上 Agentic Search 就够了,GraphRAG 的额外投入几乎白费。但如果你要做复杂的多跳推理——比如"这两栋建筑是否在同一个街区"这种需要跨文档拼线索的问题——GraphRAG 仍然是不可替代的,准确率平均领先+26.25。
这就是纽约大学上海团队最新论文的核心结论。他们搭建了一个叫RAGSearch的统一基准,第一次在公平条件下系统地回答了这个问题。
GraphRAG 和 Agentic Search 到底在争什么
先说清楚两件事的差别。
显式结构 vs 隐式结构
Dense RAG的思路很直接:把文档切成小块,搜索时按语义相似度捞出来,喂给大模型。简单、便宜,但只看表面相似度,不管信息之间的关联。
GraphRAG的思路是先花时间把文档整理成一张"知识地图"——可以是层次树、实体关系图、超图。搜索时按图索骥,能沿着关联路径把分散的证据串起来。在多跳推理上碾压 Dense RAG,但构建一张图要花$13.19 / 百万 token和1.72 小时。
Agentic Search是第三条路:不建图,而是让大模型像侦探一样"边想边搜"——先搜一轮,看到结果后判断还缺什么,再搜一轮,多轮交互把线索拼起来。它通过在线交互引入隐式结构,而不是像 GraphRAG 那样靠离线建图引入显式结构。
核心问题就变成了:Agentic Search 的隐式结构,能不能替代 GraphRAG 的显式结构?
怎么比才公平
之前的比较有个大问题——各家用的模型不一样、检索次数不一样、评测数据也不一样,结论谁也不服谁。
RAGSearch 基准架构
RAGSearch 的做法是把这些变量全控制住:
- 同一个 LLM 骨干(Qwen2.5 系列)
- 同一个检索预算(top-5)
- 同一套推理协议
- 完整的测试集(不是采样)
然后只换检索后端:Dense RAG 对比 5 种 GraphRAG(GraphRAG、RAPTOR、HippoRAG2、HypergraphRAG、LinearRAG),上面跑 4 种 Agentic 系统(Search-o1、GraphSearch、Search-R1、Graph-R1),在 6 个问答数据集上全面评测。
三个关键结论
结论一:简单问答,GraphRAG 几乎没优势
在 General QA(NQ、PopQA、TriviaQA)上,Dense RAG 的表现已经足够好,GraphRAG 的平均提升只有+0.47——几乎可以忽略。考虑到 GraphRAG 的构建成本,这笔投入在简单问答场景下是不划算的。
结论二:复杂推理,GraphRAG 仍然碾压
在 Multi-hop QA(HotpotQA、2Wiki、Musique)上,情况完全不同。GraphRAG 的平均提升达到+26.25。以 HotpotQA 为例,单次推理下 GraphRAG 达到46.70,而 Dense RAG 只有 19.00——差距是+27.70。
加入 Agentic Search 后,Dense RAG 确实追近了一些。在 GraphSearch 下,Dense RAG 的多跳差距缩小了 **32.3%**。但追近不等于追平——GraphSearch 搭配 HippoRAG2 在 HotpotQA 上达到58.64,而搭配 Dense RAG 只有 38.22。
RL-based 系统性能对比
结论三:设计好的流程比训练模型更有效
这个发现有点反直觉。GraphSearch 是一个免训练系统,完全靠提示词和流程设计实现多轮检索。但它在多数 benchmark 上优于 Search-R1 和 Graph-R1——这两个是用强化学习专门训练过的系统。
例如在 NQ 上,GraphSearch + Dense RAG 达到58.27,而 Search-R1 只有 48.72。这说明在 Agentic Search 领域,**"怎么设计搜索流程"可能比"怎么训练模型"更重要**。
还有一个发现值得注意:更大的模型本身就能缩小 GraphRAG 和 Dense RAG 的差距。从 3B 换到 7B,差距从14.70 缩小到 9.75。更强的推理能力让模型更擅长利用隐式结构。
成本是关键变量
GraphRAG 不是免费的午餐。来看构建成本:
最贵的 GraphRAG 每百万 token 要花13.19 美元和近两小时。如果你的任务主要是简单问答,这笔钱基本白花。但如果是复杂推理,这笔投入换来的是+26 的准确率提升——很值。
另外 GraphRAG 在 Agentic Search 中表现更稳定:检索召回率更高、结果方差更低,说明图结构让多轮搜索更可靠。
这意味着什么
这篇论文给了一个非常实用的决策框架:
- 做简单问答?Dense RAG + Agentic Search 就够了,别花冤枉钱建图
- 做复杂多跳推理?GraphRAG 仍然值得投入,尤其是以实体为核心的 HippoRAG2
- 在选 Agentic 系统时?先把搜索流程设计好,再考虑要不要上 RL 训练
- 预算有限?LinearRAG 构建成本为零但仍有不错效果,是一个折中选择
更深层地说,Agentic Search不是在替代 GraphRAG,而是在重新分配"结构"出现的位置——从离线图构建转移到在线交互。理解这个平衡,才是设计下一代 RAG 系统的关键。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
