LangChain框架解析：从RAG到Agent，快速构建大模型应用-尧图网站建设

📅 发布时间：2026/7/1 5:36:40

如果你正在开发大模型应用，却感觉 API 调用简单、复杂逻辑难搞，或者想快速集成检索、记忆、工具调用等能力，那么 LangChain 就是你绕不开的框架。它不是一个大模型，而是一个专为构建基于大语言模型（LLM）的应用而设计的开源框架。简单说，LangChain 把调用大模型、处理数据、管理对话、使用外部工具等一系列复杂操作，封装成了标准化、可组合的“积木块”，让你能像搭积木一样快速构建出功能强大的 AI 应用。

为什么大模型应用离不开它？因为单纯调用大模型的 API，你得到的只是一个“聪明的文本生成器”。而现实中的应用需求，比如让 AI 基于你的私有数据回答问题（RAG）、让 AI 按步骤执行复杂任务（Agent）、或者记住多轮对话的上下文（Memory），都需要大量的工程化代码。LangChain 的核心价值，就是把这些通用且复杂的模式抽象成模块，极大地降低了开发门槛，让你能专注于业务逻辑，而不是重复造轮子。

本文将带你彻底搞懂 LangChain：它到底是什么、核心组件有哪些、能解决哪些实际问题，并通过一个从零开始的 RAG 应用构建实例，让你直观感受其威力。无论你是想入门 AI 应用开发，还是已经在实践中遇到了瓶颈，这篇文章都能提供清晰的路径和可落地的代码。

1. 核心能力速览：LangChain 能做什么？

在深入细节前，我们先通过一个表格快速了解 LangChain 的核心能力边界，这有助于判断它是否适合解决你当前的问题。

能力项	说明与典型场景
核心定位	大语言模型（LLM）应用开发框架，提供模块化组件和链式编排能力。
主要功能	模型调用与抽象：统一接口调用不同厂商（OpenAI、Anthropic、国内厂商）的模型。提示词管理：模板化、动态生成提示词，支持少量示例（Few-Shot）。数据检索增强（RAG）：连接外部知识源（文档、数据库），让模型回答“未知”问题。智能体（Agent）：让模型自主选择使用工具（搜索、计算、API调用）来完成复杂任务。记忆（Memory）：管理对话历史，实现多轮上下文连贯的对话。链（Chains）：将多个组件（模型、提示词、工具）组合成可复用的工作流。
硬件/环境门槛	无特殊要求。LangChain 是 Python/JS 库，运行环境取决于你集成的 LLM 服务。调用云端 API（如 OpenAI）只需网络；本地部署模型则需要相应 GPU/CPU 资源。
启动与部署	作为开发库集成到你的 Python/Node.js 项目中，通过`pip install langchain`安装。没有独立的“服务”需要启动，它赋能于你的应用代码。
接口与扩展	提供丰富的集成接口：与向量数据库（Chroma, Pinecone）、文档加载器（PDF, Word）、工具（搜索引擎、Python REPL）等无缝连接。高度模块化，易于自定义扩展。
适合场景	快速构建聊天机器人、智能问答系统、文档分析助手、自动化工作流、复杂任务规划 Agent 等任何需要与大模型深度交互的应用。
不适合场景	单纯的模型微调训练、底层的模型推理优化、或不需要复杂逻辑编排的简单一次性文本生成。

简单来说，当你需要让大模型“做更多事”而不仅仅是“说一段话”时，就是 LangChain 的用武之地。

2. 为什么需要 LangChain？大模型应用的现实挑战

要理解 LangChain 的价值，得先看清直接使用大模型 API 的局限性。假设你想做一个公司内部知识库的问答机器人。

挑战一：上下文长度限制。公司手册有1000页，而模型的上下文窗口可能只有128K tokens，无法一次性全部输入。
挑战二：数据实时性。模型训练数据有截止日期，无法回答关于最新政策或数据的问题。
挑战三：复杂任务分解。用户问“对比一下A产品和B产品在Q3的销售额，并写一份摘要报告”。这需要查询数据库、进行计算、再生成文本，模型无法独立完成。
挑战四：提示词工程复杂。为了获得稳定、高质量的答案，你需要精心设计包含角色、指令、格式的提示词，这在多轮对话中难以维护。
挑战五：集成与编排。你需要把调用模型、查询数据库、记录历史等步骤串联起来，代码会很快变得冗长且难以维护。

LangChain 的解决方案正是针对这些痛点：

对于挑战一和二：它提供了RAG（检索增强生成）范式。自动将长文档切片、向量化存储，在提问时先检索相关片段，再将片段和问题一起交给模型生成答案，完美突破上下文限制并融入最新知识。
对于挑战三：它提供了Agent（智能体）框架。为模型定义一系列工具（如搜索工具、计算器、数据库查询API），模型可以“思考”后自主决定调用哪个工具、按什么顺序调用，最终完成任务。
对于挑战四：它提供了Prompt Templates和FewShotPromptTemplate等组件，让提示词的构建和管理变得标准化、可复用。
对于挑战五：它提供了Chain和LCEL（LangChain Expression Language）这种声明式的编排语言，让你用清晰的流水线描述复杂工作流，代码简洁且易调试。

3. LangChain 核心组件深度拆解

LangChain 的架构是模块化的，理解其核心组件是灵活运用的关键。下图展示了其核心模块及其在应用中的协作关系：

flowchart TD A[用户输入/查询] --> B[LangChain 应用] subgraph B [核心处理流程] direction LR C[检索器<br>Retriever] --> D[大语言模型<br>LLM] E[提示词模板<br>PromptTemplate] --> D D --> F[输出解析器<br>Output Parser] end subgraph G [支持与存储系统] H[向量存储<br>Vector Store] I[外部工具<br>Tools] J[记忆系统<br>Memory] end G -- 为流程提供数据与能力支持 --> B F --> K[结构化输出/答案]

3.1 模型 I/O（Model I/O）：与 LLM 对话的基础层

这是最底层，负责与各种大模型交互。

LLMs：专门用于处理非聊天场景、输入输出均为简单文本的模型接口。
Chat Models：专为聊天对话优化的模型接口（如 GPT-4， Claude），输入是结构化的消息列表（SystemMessage,HumanMessage,AIMessage）。
Prompts：管理提示词的组件。PromptTemplate允许你创建带变量的模板，例如“请用{style}风格总结以下内容：{text}”。
Output Parsers：将模型输出的非结构化文本解析成你需要的结构化数据（如 JSON、Python 对象）。

3.2 检索（Retrieval）：RAG 的引擎

这是实现知识增强的核心。

Document Loaders：从各种来源（PDF、Word、网页、数据库）加载文档。
Text Splitters：将长文档切割成适合模型处理的小片段（Chunks）。
Vector Stores：将文本片段转化为向量（Embeddings）并存储，支持相似性搜索。LangChain 集成了 Chroma、Pinecone、Weaviate 等主流向量数据库。
Retrievers：封装了从向量库中根据问题检索相关片段的逻辑。

3.3 智能体（Agents）：让模型学会“使用工具”

这是实现复杂任务自动化的关键。

Tools：模型可以调用的函数，比如搜索、计算、调用 API。你需要明确定义工具的输入参数和功能描述。
Agent：代理的核心逻辑。它通常包含一个LLM、一组Tools和一个决定如何调用工具的AgentExecutor。模型会根据当前状态和目标，决定下一步是调用工具还是直接给出最终答案。

3.4 链（Chains）与 LCEL：工作流的编排器

这是将零散组件组合成应用的“粘合剂”。

Chain：将多个组件按顺序组合起来的工作流。最简单的链是LLMChain（提示词 + 模型）。
LCEL (LangChain Expression Language)：这是 LangChain 推荐的新范式。它使用管道符|来直观地组合组件，代码更简洁、支持流式输出、并行处理等高级特性。例如：prompt \| llm \| output_parser。

3.5 记忆（Memory）：管理对话状态

用于在多次交互中保持状态。

ConversationBufferMemory：简单存储所有历史对话。
ConversationBufferWindowMemory：只保留最近 K 轮对话。
ConversationSummaryMemory：将历史对话总结成一段摘要，节省 tokens。

4. 环境准备与快速开始

LangChain 本身对环境要求极低，核心是 Python 环境。真正的资源需求取决于你后面选择的 LLM 和向量数据库。

4.1 基础环境准备

Python：确保已安装 Python 3.8 或更高版本。
包管理工具：使用pip或conda。
安装 LangChain：这是最核心的一步。
```
pip install langchain
```
根据你的需求，通常还需要安装其他集成包，例如用于 OpenAI 模型：
```
pip install langchain-openai
```
用于本地向量数据库 Chroma：
```
pip install langchain-chroma
```

4.2 选择你的 LLM 后端

LangChain 支持众多模型，你需要选择一个并配置其 API 密钥或本地访问方式。

云端 API（推荐入门）：如 OpenAI、Anthropic、智谱 AI、百度千帆等。需要申请 API Key。
本地模型：通过Ollama、vLLM或Transformers库部署本地模型。这需要一定的 GPU 资源。

本文后续示例将使用OpenAI GPT-3.5-turbo作为模型，因为它最通用且稳定。请确保你已拥有 OpenAI API Key。

5. 实战：从零构建一个 RAG 问答应用

现在，我们用一个完整的例子，将上述组件串联起来，构建一个能回答特定文档内容问题的助手。假设我们有一份“AI 发展报告.pdf”，想让 AI 基于这份报告的内容回答问题。

5.1 步骤一：加载与处理文档

首先，安装必要的文档加载器（这里用 PyPDF）和文本嵌入模型（用 OpenAI 的 embeddings）。

pip install pypdf langchain-openai

# 1. 导入必要的模块 from langchain_community.document_loaders import PyPDFLoader from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain_openai import OpenAIEmbeddings from langchain_chroma import Chroma import os # 2. 设置你的 OpenAI API Key os.environ["OPENAI_API_KEY"] = "你的-api-key-here" # 3. 加载 PDF 文档 loader = PyPDFLoader("./AI发展报告.pdf") # 替换为你的文件路径 documents = loader.load() # 4. 分割文本 text_splitter = RecursiveCharacterTextSplitter( chunk_size=500, # 每个片段约500字符 chunk_overlap=50 # 片段间重叠50字符，保持上下文 ) chunks = text_splitter.split_documents(documents) print(f"将文档切分成了 {len(chunks)} 个片段。")

5.2 步骤二：创建向量数据库

将文本片段转化为向量并存入向量数据库，以便后续检索。

# 5. 初始化嵌入模型 embeddings = OpenAIEmbeddings() # 6. 创建并持久化向量存储 vectorstore = Chroma.from_documents( documents=chunks, embedding=embeddings, persist_directory="./chroma_db" # 向量数据库本地存储路径 ) vectorstore.persist() # 保存到磁盘 print("向量数据库已创建并保存。")

5.3 步骤三：构建检索链

现在，我们将检索器（从向量库找答案）和语言模型（生成最终答案）组合成一个链。

# 7. 导入链和模型相关模块 from langchain_openai import ChatOpenAI from langchain.chains import RetrievalQA from langchain.prompts import PromptTemplate # 8. 从已保存的向量库加载检索器 vectorstore = Chroma( persist_directory="./chroma_db", embedding_function=embeddings ) retriever = vectorstore.as_retriever(search_kwargs={"k": 3}) # 检索最相关的3个片段 # 9. 定义提示词模板，指导模型如何利用检索到的上下文 prompt_template = """请根据以下上下文来回答问题。如果你不知道答案，就说不知道，不要编造。 上下文： {context} 问题： {question} 请用中文给出答案：""" PROMPT = PromptTemplate( template=prompt_template, input_variables=["context", "question"] ) # 10. 初始化大语言模型 llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0) # 11. 创建检索问答链 qa_chain = RetrievalQA.from_chain_type( llm=llm, chain_type="stuff", # 将检索到的所有上下文“塞”进提示词 retriever=retriever, chain_type_kwargs={"prompt": PROMPT}, return_source_documents=True # 返回参考来源 )

5.4 步骤四：进行问答测试

应用构建完成，现在可以提问了。

# 12. 提出问题 question = "报告中提到AI发展的主要挑战是什么？" result = qa_chain.invoke({"query": question}) print(f"问题：{question}") print(f"答案：{result['result']}") print("\n--- 参考来源 ---") for i, doc in enumerate(result['source_documents'][:2]): # 显示前两个来源 print(f"片段 {i+1}: {doc.page_content[:200]}...") # 预览片段前200字符

运行这段代码，你将得到一个基于文档内容生成的答案，并看到答案所依据的原文片段。这就是 RAG 的核心：答案源于你提供的知识，而非模型固有的训练数据。

6. 进阶探索：使用 LCEL 构建更灵活的链

上述RetrievalQA是一个高级封装。为了更精细的控制和了解底层流程，我们可以用 LCEL 重写这个 RAG 链。LCEL 的写法更清晰，且天然支持流式输出等特性。

from langchain_core.output_parsers import StrOutputParser from langchain_core.runnables import RunnablePassthrough # 1. 定义处理函数：将检索到的文档列表合并成上下文字符串 def format_docs(docs): return "\n\n".join(doc.page_content for doc in docs) # 2. 使用 LCEL 定义 RAG 流水线 rag_chain = ( # 第一步：接收用户问题，并保持不变地传递下去 {"context": retriever | format_docs, "question": RunnablePassthrough()} # 第二步：将上下文和问题填入提示词模板 | PROMPT # 第三步：将填充好的提示词发送给大模型 | llm # 第四步：将模型的输出解析为纯文本字符串 | StrOutputParser() ) # 3. 调用链 question = "AI在哪些行业有应用前景？" answer = rag_chain.invoke(question) print(answer)

LCEL 的|语法让数据流一目了然，易于调试和扩展。例如，你可以轻松地在模型调用前加入一个日志组件。

7. 构建一个简单的 Agent（智能体）

让我们创建一个能使用搜索引擎和计算器的简单 Agent，体验让模型自主决策的魅力。这里使用 Tavily 作为搜索工具。

pip install langchain-openai langchain-community langchainhub tavily-python

import os from langchain_openai import ChatOpenAI from langchain.agents import AgentExecutor, create_tool_calling_agent from langchain import hub from langchain_community.tools.tavily_search import TavilySearchResults from langchain_core.tools import Tool # 设置 API Keys os.environ["OPENAI_API_KEY"] = "你的-openai-key" os.environ["TAVILY_API_KEY"] = "你的-tavily-key" # 在 https://tavily.com 申请 # 1. 定义工具 def multiplier(a: float, b: float) -> float: """Multiply two numbers.""" return a * b # 将函数包装成 LangChain Tool tools = [ TavilySearchResults(max_results=2), # 网络搜索工具 Tool( name="Multiplier", func=multiplier, description="Useful for multiplying two numbers together.", ) ] # 2. 获取预设的 Agent 提示词（从 LangChain Hub） prompt = hub.pull("hwchase17/openai-tools-agent") # 3. 初始化模型（必须支持 tool calling，如 gpt-3.5-turbo 或 gpt-4） llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0) # 4. 创建 Agent agent = create_tool_calling_agent(llm, tools, prompt) # 5. 创建执行器 agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True) # 6. 运行 Agent，它会自己决定是否以及如何使用工具 result = agent_executor.invoke({ "input": "昨天北京天气怎么样？然后把结果乘以2。" }) print(result["output"])

运行后，你会看到verbose=True模式下 Agent 的思考过程：它可能先调用搜索工具获取天气，然后调用乘法工具进行计算，最后整合信息给出答案。

8. 常见问题与排查方法

在学习和使用 LangChain 过程中，你可能会遇到以下典型问题。

问题现象	可能原因	排查方式	解决方案
导入错误：`No module named ‘langchain_xxx’`	未安装对应的集成包。LangChain 核心库拆分为多个子包。	检查错误信息中缺失的模块名。	使用`pip install langchain-community`或`pip install langchain-openai`等命令安装特定集成包。
API 调用超时或失败	网络问题、API Key 错误或额度不足、模型服务不稳定。	1. 检查网络连接。 2. 验证 API Key 是否正确且有效。 3. 查看服务商状态页。	1. 配置代理或检查网络。 2. 更换或充值 API Key。 3. 重试或切换备用模型。
RAG 效果差，答案不准确	1. 文本切分不合理（chunk_size 过大或过小）。 2. 检索到的片段不相关。 3. 提示词模板未有效约束模型。	1. 检查检索到的`source_documents`是否与问题相关。 2. 调整`chunk_size`和`chunk_overlap`。 3. 优化提示词，加入“严格基于上下文”的指令。	1. 优化文本分割策略，尝试不同的`TextSplitter`。 2. 调整检索器的`search_kwargs`（如`k`值）。 3. 使用更高质量的嵌入模型。
Agent 陷入循环或错误使用工具	1. 工具描述不清晰。 2. 模型能力不足（如使用不支持 tool calling 的模型）。 3. Agent 类型选择不当。	1. 查看`verbose`日志，观察模型的思考过程。 2. 确认模型是否支持`tool calling`。	1. 为工具编写更精确的`description`。 2. 升级到更强的模型（如 GPT-4）。 3. 尝试不同的 Agent 类型（如`ZERO_SHOT_REACT_DESCRIPTION`）。
处理长文档时内存/显存溢出	1. 一次性加载了超大文件。 2. 嵌入模型在本地运行且显存不足。 3. 链式操作中间结果过大。	监控任务管理器的内存/显存占用。	1. 使用流式文档加载器。 2. 使用云端嵌入 API（如 OpenAIEmbeddings）。 3. 优化流程，及时清理中间变量。
向量数据库连接失败	1. 本地向量数据库服务未启动（如 Chroma 服务模式）。 2. 云端向量数据库配置错误（如索引名、API Key）。	检查向量数据库客户端的连接字符串和认证信息。	1. 对于本地 Chroma，确保使用`persist_directory`持久化模式，或正确启动客户端。 2. 仔细核对云端服务的配置。

9. 最佳实践与使用建议

从简单开始，逐步复杂：不要一开始就设计庞大的 Agent 系统。先从LLMChain和RetrievalQA这种高级链入手，理解原理后再用 LCEL 构建自定义链，最后再挑战多工具 Agent。
重视提示词工程：即使有了 LangChain，好的提示词依然是获得高质量输出的关键。充分利用PromptTemplate、FewShotPromptTemplate和ChatPromptTemplate来管理你的提示词。
管理好依赖和版本：LangChain 生态更新较快，使用requirements.txt或pyproject.toml精确锁定版本，避免因版本升级导致代码报错。
为生产环境做好准备：
- 错误处理：对模型调用、工具调用添加重试和超时机制。
- 日志与监控：记录关键步骤的输入输出，便于调试和追踪。
- 成本控制：监控 Token 使用量，特别是使用付费 API 时。
- 安全与合规：对用户输入进行过滤，避免 Prompt 注入攻击；确保 RAG 中使用的数据有合法版权。
利用好社区资源：
- LangChain Hub：一个分享和发现优质提示词和链的平台。
- 官方文档和 Cookbook：提供了大量按场景划分的示例代码。
- GitHub Issues：遇到问题时先搜索，很可能已有解决方案。

LangChain 的核心思想是“组合优于继承”。它不强迫你使用一套固定的架构，而是提供了一套丰富的、可互操作的组件。你的学习路径应该是：理解每个组件能做什么（Model I/O, Retrieval, Agents, Chains），然后像搭积木一样，用 LCEL 或 Chain 的思维将它们组合起来，解决你的具体问题。从今天开始，尝试用 LangChain 将你的一个想法变成可运行的 AI 应用原型，这是掌握它的最佳方式。