当前位置：首页 > news >正文

为什么你的知识库回答不了“张三和B公司什么关系“

news 2026/6/11 12:27:10

最近因为工作经常接触 agent、知识库、RAG 这些词，每次遇到新概念都会去查一查，但一直没系统整理过。

今天想聊聊一个基础但重要的问题：AI 是怎么"长脑子"的？我们提问时，它是怎么检索信息的？

先说传统 RAG

RAG（Retrieval-Augmented Generation）是目前最主流的方案，原理不复杂，三步走：

•切块：把文档切成几百字的小段

•向量化：每段转成一串数字（向量）

•检索：提问时把问题也转成向量，找到最相似的几段，交给大模型总结

这套方案用于处理结构化信息够用了。但如果你的知识库需要理解实体之间的关系，传统 RAG 就有点力不从心。

举个例子：

文档 A 写了"张三是 A 公司的法人"，文档 B 写了"A 公司全资控股 B 公司"。你问"张三和 B 公司有什么关系？"——传统 RAG 很难把这两块分散的文本拼起来回答。

再比如问"这份报告的三大核心风险是什么？"，如果风险分散在 10 个章节里，传统 RAG 只能召回含"风险"字眼的几页纸，给不出全局总结。

简单说就是：只见树木，不见森林。

再说 Graph RAG

Graph RAG 是微软力推的新一代方案，思路完全不同——它不把文档当孤立的文本块，而是当成一张关系网：

实体与关系抽取：用大模型从文本中提炼出"人、事、物"和它们之间的关系
构建图谱：把实体和关系连成知识图谱
社区聚类（灵魂步骤）：把关系紧密的实体划分为"社区"，提前为每个社区生成全局摘要
检索时：不只找具体实体，还能调用社区摘要来回答宏观问题

这样就能回答"这本小说讲了什么？""用户反馈最核心的三个抱怨是什么？"这类需要全局视角的问题，也能顺着图谱的线条找到 A → B → C 这样的隐藏关联。

那该选哪个？

成本差异很明显。

传统 RAG 的开销主要是向量数据库，门槛不高。Graph RAG 则需要：

• 大量 LLM 调用来抽取实体和关系（算力成本不低）

• 人工审核数据准确性

• 图数据库（如 Neo4j，社区版功能有限，商业版价格不便宜）

所以，简单结构化信息 → 传统 RAG 就够了。需要复杂关系检索、深度推理的话，可以在传统 RAG 基础上辅以 Graph RAG。

可以根据场景选方案，别为了高级上 Graph RAG。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～