当前位置: 首页 > news >正文

[智能体-315]:LangChain 实现 RAG(检索增强生成)的完整工作流,并且是基于 ChatGLM 大模型的实现方案。

这张图是LangChain 实现 RAG(检索增强生成)的完整工作流,并且是基于 ChatGLM 大模型的实现方案。下面按「离线知识库构建」「在线问答推理」两大阶段,拆解每一步的作用与原理。


一、整体流程概览

整个流程分为两大阶段:

  1. 离线阶段:知识库构建(步骤 1-7)
  2. 在线阶段:问答与生成(步骤 8-15)

二、阶段 1:离线知识库构建(数据准备)

目标:把本地文档变成可被检索的向量知识库。

表格

步骤环节核心作用通俗解释
1Local Documents → Unstructured Loader加载本地非结构化文档(PDF/Word/Markdown 等),解析成纯文本把文件 “读进来”,提取文字内容
2Unstructured Loader → Text输出统一格式的纯文本解决不同文件格式的解析问题
3Text → Text Splitter按固定大小 / 语义边界,将长文本切割成短片段(Chunks)解决大模型上下文窗口限制,让文本适合后续处理
4Text Splitter → Text Chunks输出标准化文本片段每个片段都是后续向量化和检索的最小单元
5Text Chunks → Embedding使用嵌入模型,将文本片段转换为高维向量把文字变成机器能计算的数字
6Embedding → VectorStore将文本片段、向量和元数据存入向量数据库建立可快速检索的知识库
7VectorStore向量数据库就绪,支持相似度检索为后续问答提供数据支持

三、阶段 2:在线问答推理(用户提问→生成答案)

目标:基于用户问题,从知识库召回相关信息,辅助大模型生成答案。

表格

步骤环节核心作用通俗解释
8Query → Embedding将用户提问文本向量化把用户问题也变成向量,方便在知识库中匹配
9Embedding → Query Vector输出问题向量为相似度检索做准备
10Query Vector → Vector Similarity在向量数据库中计算问题向量与库中向量的相似度找出和问题语义最相关的文本片段
11Vector Similarity → Related Text Chunks召回 Top-K 个相关文本片段从知识库中取出能回答问题的参考材料
12Related Text Chunks → Prompt Template将召回的文本片段填入预设的提示词模板把参考资料和用户问题整合成大模型能理解的指令
13Prompt Template → Prompt输出完整的提示词(包含用户问题 + 参考上下文)形成给大模型的最终输入
14Prompt → LLM(ChatGLM)调用 ChatGLM 大模型,基于提示词生成回答让大模型结合参考资料回答问题
15LLM → Answer输出最终答案呈现给用户的结果

四、关键模块解析

1. Text Splitter(文本分割)

  • 核心目的:解决长文本超出大模型上下文窗口的问题,同时保证分割后的片段语义完整。
  • 常见策略:按字符数分割、按句子分割、按语义分割(如 LangChain 的RecursiveCharacterTextSplitter)。

2. Embedding(向量化)

  • 核心目的:实现自然语言的数值化,让机器可以通过向量空间的距离来判断文本语义的相似度。
  • 常见模型:OpenAI Embeddings、BGE、Sentence-BERT,国内场景也可使用与 ChatGLM 配套的嵌入模型。

3. VectorStore(向量数据库)

  • 核心目的:高效存储和检索向量,支持亿级数据下的毫秒级召回。
  • 常见工具:Chroma、Milvus、FAISS、Pinecone,LangChain 对这些数据库都提供了统一的接口。

4. Prompt Template(提示词模板)

  • 核心目的:规范大模型的输入格式,引导模型基于召回的上下文生成答案,减少模型幻觉。
  • 典型模板:“根据以下上下文回答问题:{context}。问题:{query}。回答:”

五、与 ChatGLM 的适配

这张图是基于LangChain + ChatGLM的组合方案:

  • LangChain 提供了统一的工作流编排能力,负责数据加载、分块、向量化、检索和提示词构建;
  • ChatGLM 作为后端大模型,负责理解提示词并生成答案;
  • 这种架构的优势是:可以灵活替换嵌入模型、向量数据库和大模型,适配不同的业务场景和部署环境。

六、核心价值总结

这个流程解决了大模型的两个关键问题:

  1. 知识过时:通过向量数据库接入最新的私有数据,让模型能回答超出其训练数据范围的问题;
  2. 模型幻觉:通过召回相关上下文并引导模型基于事实生成答案,大幅降低模型编造信息的概率。
http://www.rkmt.cn/news/1481077.html

相关文章:

  • 北斗系统技术演进与工程实践:从混合星座到高精度应用
  • Notepad--完全指南:跨平台文本编辑器的终极选择
  • Burp Suite汉化终极指南:5步实现专业级中文界面
  • 解锁游戏资源宝库:WzComparerR2高效解析冒险岛WZ文件实战指南
  • 技术深度解析:LeagueAkari的模块化架构与实时数据同步系统
  • 3步搞定B站视频下载:免费获取4K高清大会员视频的终极指南
  • Packmol分子动力学构型构建:从零到一的完整实战指南
  • 智能家居本地化控制的技术迷思与实践突破:从云端依赖到自主掌控的演进之路
  • Windows安卓应用安装终极指南:告别模拟器,3分钟开启电脑玩转手机应用!
  • NFC卡片管理终极方案:MifareOneTool让MIFARE Classic操作化繁为简
  • CSDN数字营销AI套餐节前调价全解析:5类用户实测降价幅度与续费黄金窗口期
  • 2026年多商户入驻商城怎么操作 - 凡科杰建云
  • 免费CAD软件终极指南:如何使用LitCAD轻松完成专业二维绘图
  • GlosSI:让Steam控制器在任意Windows游戏中畅玩的终极指南
  • Mem Reduct中文界面设置:从技术原理到实战配置的完整指南
  • CSLOL Manager:告别英雄联盟皮肤管理烦恼,开启个性化游戏体验
  • 题解:P12485 [集训队互测 2024] PM 大师
  • AppImageLauncher:告别Linux软件安装烦恼,双击即可运行AppImage应用 [特殊字符]
  • Python MIDI处理实战指南:Mido库深度解析与应用
  • STM32低功耗调试:解决STOP模式调试失效的DBGMCU配置指南
  • 英雄联盟终极自动化工具:League Akari完全使用指南
  • 【AI驱动的选题决策系统】:CSDN 237万条营销数据反哺内容策略的5大闭环验证模型
  • iOS激活锁绕过技术方案解析:applera1n的内存级安全绕过机制
  • 破解自动化间歇运动痛点:凸轮分割器四精协同方法论如何实现高精度低成本? - 速递信息
  • STM32驱动74HC595级联控制数码管的实用代码包,含中文注释与引脚配置说明
  • 深入解析LabVIEW内存数据布局:从基础类型到复杂结构的内存模型与实战应用
  • FitGirl游戏启动器完全指南:一站式管理压缩游戏的终极解决方案
  • 2026年微信小程序怎么弄出来 - 凡科杰建云
  • 在Mac上运行Windows软件的最简单方法:Whisky完整使用指南
  • C++实现的VIBE+卡尔曼滤波多目标跟踪系统(含匈牙利匹配与背景减除)