55 个 AI 基础核心概念
零、术语中英文对照表
| 英文术语(缩写) | 中文名称 | 简要说明 |
|---|---|---|
| AI (Artificial Intelligence) | 人工智能 | 让机器模拟人类智能的科学技术 |
| NLP (Natural Language Processing) | 自然语言处理 | AI 领域中专注于让计算机理解和生成自然语言的分支 |
| Token | 词元 / 令牌 | 大语言模型处理文本的基本单位 |
| Transformer | Transformer 架构 | 2017 年由 Google 提出的革命性深度学习架构,主流大模型的基石 |
| Encoder | 编码器 | Transformer 中负责"理解"输入文本的组件 |
| Decoder | 解码器 | Transformer 中负责"生成"输出文本的组件 |
| Attention | 注意力机制 | 让模型有选择性地聚焦于重要信息的机制 |
| Self-Attention | 自注意力 | 同一序列内部 Token 之间的注意力计算 |
| Cross-Attention | 交叉注意力 | 两个不同序列之间的注意力计算 |
| LLM (Large Language Model) | 大语言模型 | 基于 Transformer、参数规模巨大的语言模型 |
| Pre-trained | 预训练 | 在大规模通用语料上进行的初始训练阶段 |
| Scaling Law | 缩放法则 / 规模定律 | 模型性能随规模增长而可预测提升的规律 |
| Fine-tuning | 微调 | 在预训练模型基础上用特定数据进一步训练 |
| SFT (Supervised Fine-Tuning) | 监督微调 | 使用人工标注的高质量对话数据进行微调 |
| RLHF (Reinforcement Learning from Human Feedback) | 基于人类反馈的强化学习 | 通过人类反馈训练奖励模型,再用强化学习让模型对齐人类偏好 |
| Prompt | 提示 | 用户输入给大语言模型的指令、上下文等所有信息的总称 |
| RAG (Retrieval-Augmented Generation) | 检索增强生成 | 让大模型结合外部知识库解答问题的技术 |
| Jailbreak | 越狱 | 通过精心设计提示词绕过 AI 安全限制的攻击方式 |
| Red Teaming | 红队测试 | 主动模拟攻击来发现 AI 系统安全漏洞的测试方法 |
| Constitutional AI | 宪法 AI | Anthropic 提出的用预设行为准则让 AI 自我修正的对齐方法 |
| Agent | 智能体 | 能自主感知环境、规划决策并执行行动的 AI 实体 |
| Agentic | 智能体化的 | 描述具有 Agent 特性的系统或方法 |
| Alignment | 对齐 | 让 AI 的目标和价值观与人类保持一致的核心安全概念 |
| Alignment Tax | 对齐税 | 为提高 AI 安全性而在性能或效率上付出的代价 |
| Instruction | 指令 | 用户给 AI 的明确任务或要求 |
| Temperature | 温度 | 控制生成文本随机性的参数 |
| Top k / Top p (Nucleus Sampling) | 核采样 | 控制生成随机性的采样方法 |
| Inference | 推理 / 推断 | 模型训练完成后根据输入生成输出的过程 |
| Context / Context Window | 上下文 / 上下文窗口 | 模型在一次对话中能处理的最大信息量 |
| KV Cache | 键值缓存 | 缓存推理中间结果、加速推理的技术 |
| Hallucination | 幻觉 | 模型生成听起来合理但实际不真实的内容 |
| Memory | 记忆 | AI 跨会话存储和调用信息的能力 |
| CoT (Chain-of-Thought) | 思维链 | 让模型一步步思考来解决复杂问题的技术 |
| In-Context Learning | 上下文学习 | 不用重新训练,仅通过输入示例就能学会新任务的能力 |
| MoE (Mixture of Experts) | 混合专家模型 | 按需激活部分参数,实现大模型能力、小模型成本 |
| Multi-Modal | 多模态 | AI 同时处理文本、图像、音频等多种信息的能力 |
| Benchmark | 基准测试 | 标准化测试集,用于衡量和比较模型性能 |
| Function Calling | 函数调用 | 大模型判断需要调用外部工具并生成调用参数的能力 |
| Tool | 工具 | AI Agent 可调用的外部功能或资源 |
| MCP (Model Context Protocol) | 模型上下文协议 | Anthropic 推出的连接大模型与外部工具的统一标准 |
| Planning | 规划 | Agent 将复杂目标拆解为子任务并逐步执行的能力 |
| Agent Skill | 智能体技能 | Agent 框架中封装好的可复用能力模块 |
| System 2 Thinking | 系统 2 思维 | 慢速、深思熟虑的推理方式,提升复杂任务可靠性 |
| Synthetic Data | 合成数据 | 人工生成、非真实世界收集的训练数据 |
| Edge AI | 端侧 AI | 将模型部署到本地设备,不完全依赖云端 |
| Model Router | 模型路由 | 按任务难度和成本自动选择最合适模型的调度机制 |
| World Model | 世界模型 | 能构建世界内部表示并预测状态变化的 AI 系统 |
| AGI (Artificial General Intelligence) | 通用人工智能 | 具备与人类同等智能水平、能解决各种任务的 AI |
| ASI (Artificial Super Intelligence) | 超级人工智能 | 在所有领域远超人类智能水平的 AI |
| Embedding | 嵌入 / 向量嵌入 | 将非结构化数据转换为数值向量的技术 |
| Knowledge Graph | 知识图谱 | 用图结构表示知识,由实体和关系组成 |
| Prompt Injection | 提示注入 | 通过嵌入恶意指令让模型忽略安全规则的攻击方式 |
| Guardrails | 安全护栏 | AI 系统中防止输出有害或违规内容的安全机制 |
| Mixture of Agents | 混合智能体 | 多个 AI 智能体分工协作完成复杂任务的架构 |
| Retrieval | 检索器 | RAG 系统中负责从知识库查找相关文档的模块 |
| Grounding | 接地 / 事实性 | 让模型输出与真实世界事实保持一致 |
| Knowledge Cutoff | 知识截止日期 | 模型训练数据的时间截止点 |
| Reasoning | 推理能力 | 通过逻辑分析、推导来解决问题的能力 |
一、基础中的基础 ——AI 与语言模型的起点
AI (Artificial Intelligence,人工智能)
机器学习:让机器从数据中学习规律和经验
深度学习:用多层神经网络模拟人脑学习
大模型 / 大语言模型:以海量数据和参数,让机器能理解和生成人类的语言
NLP (Natural Language Processing,自然语言处理)
- NLP 是 AI 的一个核心子领域,专注于让计算机理解、解释、生成人类的自然语言
Token (词元 / 令牌)
Token 是大语言模型处理文本时的基本单位
一个 Token 可能是一个字、一个词,或是文本的一部分
Transformer 架构
2017 年由 Google 提出的革命性深度学习架构
几乎所有主流大模型(GPT、Claude、Gemini、LLaMA 等)都基于 Transformer
包含两个主要部分:
Encoder (编码器):负责 “理解” 输入文本
Decoder (解码器):负责 “生成” 输出文本
只有解码器的架构叫 “Decoder-only” 架构(如 GPT 系列)
Attention (注意力机制)
两种主要变体:
Self-Attention (自注意力):一段文本内部,每个 Token 都和其他所有 Token 计算关联度
Cross-Attention (交叉注意力):两段文本之间的注意力
让模型在处理信息时能够有选择性地聚焦于重要部分
二、大模型是怎么炼成的 —— 从预训练到微调
对比表格:Encoder 与 Decoder
| 对比维度 | Encoder(编码器) | Decoder(解码器) |
|---|---|---|
| 定义 | Transformer 架构中负责“理解”输入文本的组件,将输入序列映射为富含语义的连续表示。 | Transformer 架构中负责“生成”输出文本的组件,基于上下文和自身历史输出自回归地预测下一个 Token。 |
| 核心作用 | 提取句子中各 Token 的全局上下文特征,捕捉双向依赖关系,产出可用作下游任务输入的编码向量。 | 根据编码器(或自身)给出的上下文表示,逐词生成连贯的输出序列,天然支持从左到右的自回归生成。 |
| 典型应用场景 | BERT、RoBERTa等只使用 Encoder 的模型,广泛应用于文本分类、命名实体识别、问答等理解型任务。 | GPT系列采用 Decoder-only 架构,主要用于对话生成、故事续写、代码补全等生成型任务。 |
| 架构倾向 | 通常包含双向自注意力机制,能同时看到左右两侧的上下文。 | 使用单向(因果)自注意力,只能看到当前位置之前的内容,保证生成的一致性。 |
对比表格:Self-Attention 与 Cross-Attention
| 对比维度 | Self-Attention(自注意力) | Cross-Attention(交叉注意力) |
|---|---|---|
| 定义 | 在同一序列内部,让每个 Token 都与序列中的所有 Token(包括自身)计算注意力权重,得到融合全局信息的新表示。 | 在两个不同序列之间计算注意力,一个序列的 Token 作为 Query,从另一个序列的 Key-Value 中抽取相关信息。 |
| 核心作用 | 捕捉同一句子里词与词之间的依赖关系,解决长距离依赖问题,为每个词生成上下文感知的表示。 | 实现两个序列的信息融合,例如翻译中将源语言句子的 Key-Value 传递给解码器,使生成时能够对齐到源语内容。 |
| 典型应用场景 | Transformer 的 Encoder 和 Decoder 内部都大量使用 Self-Attention;BERT用双向 Self-Attention 学习整句理解。 | 原始 Transformer 中 Decoder 的 Cross-Attention 层,接收 Encoder 的输出作为 Key-Value;图像描述、图文匹配等多模态任务中也用 Cross-Attention 对齐不同模态。 |
| 注意力流向 | 输入来自同一序列,Query、Key、Value 均源自同一组 Token。 | Query 通常来自 Target 序列(如 Decoder 当前状态),Key、Value 来自 Source 序列(如 Encoder 输出)。 |
LLM (Large Language Model,大语言模型)
基于 Transformer 架构,通过海量文本数据预训练得到
特点:参数规模大、训练数据多、能力强
Pre-trained (预训练)
在大规模通用语料上进行的第一阶段训练
让模型获得基础的语言理解和生成能力
Scaling Law (缩放法则 / 规模定律)
大模型的性能会随着模型规模、数据量、计算量的增加而可预测地提升
模型越大、数据越多、算力越强,效果通常越好
Fine-tuning (微调)
在预训练好的模型基础上,用特定领域或任务的数据进一步训练
预训练是 “基础教育”,微调是 “专业培训”
SFT (Supervised Fine-Tuning,监督微调)
通过人工标注的高质量对话数据来训练模型
让模型学会按照人类的指令和偏好来回答问题
RLHF (Reinforcement Learning from Human Feedback)
基于人类反馈的强化学习
让大模型进一步对齐人类价值观和偏好的关键技术
先让人类给模型的回答打分排序,训练奖励模型,再用强化学习让模型生成更符合人类偏好的回答
三、提示工程与安全攻防 —— 从 Prompt 到红队测试
Prompt (提示)
用户输入给大语言模型的一段内容
不仅仅是一个问题,而是包含了指令、上下文、示例等所有输入信息的总称
RAG (Retrieval-Augmented Generation,检索增强生成)
让大模型结合外部知识库来回答问题的技术
回答问题前先从知识库中检索相关文档,再基于这些信息生成回答
解决了大模型知识截止、幻觉严重等问题
Jailbreak (越狱)
通过精心设计的提示词绕过 AI 模型的安全限制
让模型输出原本被禁止的内容(如违法信息、有害建议等)
Red Teaming (红队测试)
源自军事和网络安全领域的测试方法
主动模拟攻击来发现系统的安全漏洞
专门找人或 AI 来尝试 “攻击” 模型,测试安全边界
Constitutional AI (宪法 AI)
Anthropic 提出的 AI 对齐方法
给 AI 一套 “宪法”(行为准则和价值观),让 AI 自己根据宪法来自我修正
减少对人类标注的依赖,价值观更一致,更容易控制
Agent (智能体)
能自主感知环境、做出决策并执行行动的实体
不只是被动回答问题,而是能主动规划、调用工具、完成复杂任务
从 “对话” 到 “行动”,从 “顾问” 变成 “助理”
Agentic (智能体化的)
描述 “具有 Agent 特性的” 系统或方法
AI 系统从被动的 “问答机器” 向主动的 “任务执行者” 转变
四、大模型安全与对齐 —— 从对齐到超级对齐
Alignment (对齐)
让 AI 的目标、行为和价值观与人类的意图和价值观保持一致
让 AI 做人类真正想让它做的事,而不是表面上让它做的事
AI 安全领域的核心概念
Alignment Tax (对齐税)
为了让 AI 更安全、更对齐人类价值观,而在性能、能力或效率上付出的代价
安全和能力之间的权衡
五、让 AI"听话" 又 “靠谱”—— 对齐与生成控制
Instruction (指令)
用户给 AI 的明确任务或要求
代表了一种交互范式的转变
Temperature (温度)
调整生成文本随机性的参数
温度越高,内容越随机、越有创意;温度越低,内容越确定、越保守
Top k 采样 / Top p 采样 (Nucleus Sampling)
控制生成随机性的方法
Top k:只从概率最高的 k 个词里选下一个词
Top p:选累积概率达到 p 的最少数量的 Token
Inference (推理 / 推断)
大模型在训练完成之后,根据输入生成输出的过程
训练是 “学习”,推理是 “做题”
Context / Context Window (上下文 / 上下文窗口)
模型在一次对话中能够处理的最大信息量
模型的 “短期记忆”—— 它能记住多少之前说过的话
单位通常是 Token(词元)
KV Cache (键值缓存)
在大模型推理过程中缓存中间计算结果、加速推理的技术
把算过的中间结果记下来,下次直接用
六、大模型的 “运行时”—— 推理、上下文与幻觉
Hallucination (幻觉)
大模型生成的内容听起来很合理,但实际上是不真实的、编造的
AI 一本正经地胡说八道
大语言模型最广为人知、也最令人头疼的问题
Memory (记忆)
赋予 AI 系统跨会话、跨交互地存储和调用信息的能力
让 AI 能像人一样有 “长期记忆”
Context Window 是 “短期记忆”,Memory 是 “长期记忆”
CoT (Chain-of-Thought,思维链)
让大模型通过 “一步步思考” 来解决复杂问题的技术
让 AI 像人做数学题一样,一步一步地思考,而不是直接给答案
能显著提升大模型在数学、逻辑推理等复杂任务上的表现
In-Context Learning (上下文学习)
大模型不需要重新训练,只通过在输入中给出几个示例,就能学会新任务的能力
给 AI 看几个例子,它就学会了 —— 不用重新训练
MoE (Mixture of Experts,混合专家模型)
通过 “按需激活” 部分参数来实现 “大模型能力、小模型成本”
不同的问题交给不同的专家来处理
总参数量大,但每次推理只用到一小部分参数
Multi-Modal (多模态)
AI 能够同时处理和理解多种类型的信息(如文本、图像、音频等)
给 AI 装上了 “眼睛” 和 “耳朵”,让它能像人一样通过多种方式感知世界
Benchmark (基准测试)
用来衡量和比较 AI 模型性能的标准化测试集或任务
AI 界的 “高考”—— 用统一的题目来考不同的模型
七、AI Agent 与工具使用 —— 从 “对话” 到 “行动”
Function Calling (函数调用)
大模型能够根据用户请求,判断是否需要调用外部工具,并生成符合格式的调用参数
让大模型能 “调用工具”—— 查天气、查数据库、发邮件等
大模型从 “只会说话” 到 “能够行动” 的关键一步
Tool (工具)
AI Agent 或大模型可以调用的外部功能或资源
AI 的 “外挂装备”—— 有了它们,AI 就能做到很多原本做不到的事
MCP (Model Context Protocol,模型上下文协议)
Anthropic 推出的开放标准和协议
定义了一套统一的方式,让大模型能够方便地连接和使用各种外部工具
AI 界的 “USB 接口”—— 有了统一标准,各种工具都能方便地插上来用
Planning (规划)
Agent 的核心能力之一
拿到复杂目标后,先把它拆成一步步的小任务,然后再去执行
Agent 的 “项目经理” 能力
Agent Skill (智能体技能)
从 Agent 框架中封装好的、可以直接复用的 “能力模块”
Agent 的 “技能包”—— 学会了就能直接用
Tool 是 “单个工具”,Skill 是 “一套组合拳”
八、高级能力与前沿概念 —— 从规划到边缘部署
System 2 Thinking (系统 2 思维)
借用认知心理学中的概念,指慢思考、深思熟虑、需要付出努力的思考方式
让 AI 不只是 “凭直觉” 快速回答,而是能够 “深思熟虑”
提升复杂推理能力,减少幻觉,提高可靠性
Synthetic Data (合成数据)
人工生成的、不是从真实世界中直接收集的数据
AI 自己 “造” 出来的数据,用来训练更厉害的 AI
数据量不受限,质量可控,成本更低,隐私安全
Edge AI (端侧 AI)
将 AI 模型部署到离用户或数据产生的源头更近的设备上
在本地进行计算和推理,不需要把数据传到云端
速度快、隐私好、不依赖网络、成本低
Model Router (模型路由)
智能调度机制,根据任务的难度、类型、成本等因素,自动选择最合适的 AI 模型
AI 系统的 “调度中心”—— 简单任务用小模型,复杂任务用大模型
World Model (世界模型)
能够构建和维护一个关于世界的内部表示,并能预测未来状态、模拟行动后果的 AI 系统
AI 脑中的 “虚拟世界”—— 能理解世界是怎么运作的,并能预测接下来会发生什么
AGI / ASI (通用人工智能 / 超级人工智能)
AGI:具备与人类同等智能水平、能像人一样学习、理解、解决各种不同任务的 AI
ASI:在所有领域都远远超过人类智能水平的 AI
AGI 是 “和人一样聪明”,ASI 是 “比人聪明得多”
九、补充篇:其他重要相关概念
Embedding (嵌入 / 向量嵌入)
把文本、图片等非结构化数据转换成计算机能理解和计算的数值向量
把文字变成一串数字 —— 这串数字可以用来表示这段文字的含义
语义搜索、RAG、推荐系统、聚类分析的基础
Knowledge Graph (知识图谱)
用图结构来表示知识的方式,由实体(节点)和关系(边)组成
一张 “知识地图”—— 上面标了各种事物,以及它们之间的关系
Prompt Injection (提示注入)
一种安全攻击技术,通过在输入中嵌入恶意指令,让 AI 模型忽略原本的系统提示或安全规则
AI 时代的 “SQL 注入”—— 专门攻击大模型的安全漏洞
Guardrails (安全护栏)
在 AI 系统中设置的各种安全机制和限制
防止模型输出有害、不当或不符合要求的内容
AI 的 “安全带” 和 “保险杠”
Mixture of Agents (混合智能体)
多智能体协作架构,让多个不同的 AI 智能体分工协作,共同完成复杂任务
三个臭皮匠,顶个诸葛亮 —— 多个 AI 一起干,比一个 AI 干得好
Retrieval (检索器)
在 RAG 系统中,负责从知识库中找出与用户问题最相关的文档或信息的模块
AI 的 “图书管理员”—— 你问问题,它帮你找出最相关的资料
Grounding (接地 / 事实性)
让 AI 模型的输出与真实世界的事实、数据或知识保持一致,减少幻觉
让 AI 的回答 “有根有据”,而不是凭空编造
Knowledge Cutoff (知识截止日期)
大模型训练数据的时间截止点
在这个日期之后发生的事情,模型 “不知道”
AI 的 “知识保质期”
Reasoning (推理能力)
AI 模型通过逻辑思考、分析、推导来解决问题的能力
AI 的 “思考能力”—— 不只是记住知识,还能运用知识来解决问题