当前位置：首页 > news >正文

[智能体-315]：LangChain 实现 RAG（检索增强生成）的完整工作流，并且是基于 ChatGLM 大模型的实现方案。

news 2026/6/7 17:19:27

这张图是LangChain 实现 RAG（检索增强生成）的完整工作流，并且是基于 ChatGLM 大模型的实现方案。下面按「离线知识库构建」和「在线问答推理」两大阶段，拆解每一步的作用与原理。

一、整体流程概览

整个流程分为两大阶段：

离线阶段：知识库构建（步骤 1-7）
在线阶段：问答与生成（步骤 8-15）

二、阶段 1：离线知识库构建（数据准备）

目标：把本地文档变成可被检索的向量知识库。

表格

步骤	环节	核心作用	通俗解释
1	Local Documents → Unstructured Loader	加载本地非结构化文档（PDF/Word/Markdown 等），解析成纯文本	把文件 “读进来”，提取文字内容
2	Unstructured Loader → Text	输出统一格式的纯文本	解决不同文件格式的解析问题
3	Text → Text Splitter	按固定大小 / 语义边界，将长文本切割成短片段（Chunks）	解决大模型上下文窗口限制，让文本适合后续处理
4	Text Splitter → Text Chunks	输出标准化文本片段	每个片段都是后续向量化和检索的最小单元
5	Text Chunks → Embedding	使用嵌入模型，将文本片段转换为高维向量	把文字变成机器能计算的数字
6	Embedding → VectorStore	将文本片段、向量和元数据存入向量数据库	建立可快速检索的知识库
7	VectorStore	向量数据库就绪，支持相似度检索	为后续问答提供数据支持

三、阶段 2：在线问答推理（用户提问→生成答案）

目标：基于用户问题，从知识库召回相关信息，辅助大模型生成答案。

表格

步骤	环节	核心作用	通俗解释
8	Query → Embedding	将用户提问文本向量化	把用户问题也变成向量，方便在知识库中匹配
9	Embedding → Query Vector	输出问题向量	为相似度检索做准备
10	Query Vector → Vector Similarity	在向量数据库中计算问题向量与库中向量的相似度	找出和问题语义最相关的文本片段
11	Vector Similarity → Related Text Chunks	召回 Top-K 个相关文本片段	从知识库中取出能回答问题的参考材料
12	Related Text Chunks → Prompt Template	将召回的文本片段填入预设的提示词模板	把参考资料和用户问题整合成大模型能理解的指令
13	Prompt Template → Prompt	输出完整的提示词（包含用户问题 + 参考上下文）	形成给大模型的最终输入
14	Prompt → LLM（ChatGLM）	调用 ChatGLM 大模型，基于提示词生成回答	让大模型结合参考资料回答问题
15	LLM → Answer	输出最终答案	呈现给用户的结果

四、关键模块解析

1. Text Splitter（文本分割）

核心目的：解决长文本超出大模型上下文窗口的问题，同时保证分割后的片段语义完整。
常见策略：按字符数分割、按句子分割、按语义分割（如 LangChain 的RecursiveCharacterTextSplitter）。

2. Embedding（向量化）

核心目的：实现自然语言的数值化，让机器可以通过向量空间的距离来判断文本语义的相似度。
常见模型：OpenAI Embeddings、BGE、Sentence-BERT，国内场景也可使用与 ChatGLM 配套的嵌入模型。

3. VectorStore（向量数据库）

核心目的：高效存储和检索向量，支持亿级数据下的毫秒级召回。
常见工具：Chroma、Milvus、FAISS、Pinecone，LangChain 对这些数据库都提供了统一的接口。

4. Prompt Template（提示词模板）

核心目的：规范大模型的输入格式，引导模型基于召回的上下文生成答案，减少模型幻觉。
典型模板：“根据以下上下文回答问题：{context}。问题：{query}。回答：”

五、与 ChatGLM 的适配

这张图是基于LangChain + ChatGLM的组合方案：

LangChain 提供了统一的工作流编排能力，负责数据加载、分块、向量化、检索和提示词构建；
ChatGLM 作为后端大模型，负责理解提示词并生成答案；
这种架构的优势是：可以灵活替换嵌入模型、向量数据库和大模型，适配不同的业务场景和部署环境。

六、核心价值总结

这个流程解决了大模型的两个关键问题：

知识过时：通过向量数据库接入最新的私有数据，让模型能回答超出其训练数据范围的问题；
模型幻觉：通过召回相关上下文并引导模型基于事实生成答案，大幅降低模型编造信息的概率。

http://www.rkmt.cn/news/1481077.html

相关文章：

北斗系统技术演进与工程实践：从混合星座到高精度应用

Notepad--完全指南：跨平台文本编辑器的终极选择

Burp Suite汉化终极指南：5步实现专业级中文界面

解锁游戏资源宝库：WzComparerR2高效解析冒险岛WZ文件实战指南

技术深度解析：LeagueAkari的模块化架构与实时数据同步系统

3步搞定B站视频下载：免费获取4K高清大会员视频的终极指南

Packmol分子动力学构型构建：从零到一的完整实战指南

智能家居本地化控制的技术迷思与实践突破：从云端依赖到自主掌控的演进之路

Windows安卓应用安装终极指南：告别模拟器，3分钟开启电脑玩转手机应用！

NFC卡片管理终极方案：MifareOneTool让MIFARE Classic操作化繁为简

CSDN数字营销AI套餐节前调价全解析：5类用户实测降价幅度与续费黄金窗口期

2026年多商户入驻商城怎么操作 - 凡科杰建云

免费CAD软件终极指南：如何使用LitCAD轻松完成专业二维绘图

GlosSI：让Steam控制器在任意Windows游戏中畅玩的终极指南

Mem Reduct中文界面设置：从技术原理到实战配置的完整指南

CSLOL Manager：告别英雄联盟皮肤管理烦恼，开启个性化游戏体验

题解：P12485 [集训队互测 2024] PM 大师

AppImageLauncher：告别Linux软件安装烦恼，双击即可运行AppImage应用 [特殊字符]

Python MIDI处理实战指南：Mido库深度解析与应用

STM32低功耗调试：解决STOP模式调试失效的DBGMCU配置指南

英雄联盟终极自动化工具：League Akari完全使用指南

【AI驱动的选题决策系统】：CSDN 237万条营销数据反哺内容策略的5大闭环验证模型

iOS激活锁绕过技术方案解析：applera1n的内存级安全绕过机制

破解自动化间歇运动痛点：凸轮分割器四精协同方法论如何实现高精度低成本？ - 速递信息

STM32驱动74HC595级联控制数码管的实用代码包，含中文注释与引脚配置说明

深入解析LabVIEW内存数据布局：从基础类型到复杂结构的内存模型与实战应用

FitGirl游戏启动器完全指南：一站式管理压缩游戏的终极解决方案

2026年微信小程序怎么弄出来 - 凡科杰建云

在Mac上运行Windows软件的最简单方法：Whisky完整使用指南

C++实现的VIBE+卡尔曼滤波多目标跟踪系统（含匈牙利匹配与背景减除）