尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

大模型思维链(CoT)理论梳理

大模型思维链(CoT)理论梳理
📅 发布时间:2026/6/30 16:19:50

目录

  • 一、什么是思维链?
  • 二、用来干什么
  • 三、发展脉络
  • 四、如何开启推理
    • 4.1 普通模型:提示词工程
    • 4.2 推理模型:默认开启,不可关闭
    • 4.3 当代模型:可开关的思考模式
  • 五、总结

一、什么是思维链?

一句话总结,思维链(Chain of Thought,CoT),它是一种提示工程技术——引导大模型在给出最终答案之前,先输出一系列中间推理步骤。
是由Goolge在2022年1月提出的
思维链并没有给大模型增加任何新功能,而是激活大模型本来就有的潜能,不让其跳过中间推理步骤,而是将输出的推理过程作为新的推理前文,逐步逼近答案。

类比做数学题,是直接给出答案,还是一步步写出中间过程,最后算出答案,肯定是后者的正确率高

二、用来干什么

核心用途是提升大模型在需要多步推理的复杂任务上的表现。具体来说:

  1. 分解复杂任务:模型将复杂问题拆解为更小、更易于管理的子任务,依次解决。
  2. 减少推理错误:分步推导降低了“一步到位”时常见的逻辑跳跃错误。
  3. 提高可解释性:用户可以看到模型的推理逻辑,便于调试和建立信任。
  4. 便于纠错:当中间步骤出错时,可以精准定位问题所在,而不是面对一个“黑箱答案”无从下手。

三、发展脉络

  1. 2022年 发现思维链的存在,利用提示词工程,激活思维链
  2. 2024年 推理模型兴起,通过大规模强化学习将思维链能力内化到模型内部,模型强制自动推理,不需要提示词激活。代表模型DeepSeek R1
  3. 2026年,推理能力(思考模式)”已是一项内置的核心功能,模型不再强制推理
    可以选择是否开启推理,以及推理强度。代表模型deepseek-v4-pro
    甚至有的模型可以自动决定是否开启思考模式(自适应思考),代表模型caude 4.8 和 chatGpt 5.5

四、如何开启推理

4.1 普通模型:提示词工程

推理能力完全依赖提示词工程来激活,代表模型deepseek-v3,本地部署轻量模型等

开启方式:

  • 零样本思维链(Zero-Shot CoT) :在问题后直接添加触发短语,如“让我们一步步思考“”。模型会据此输出推理步骤。
  • 少样本思维链(Few-Shot CoT) :在提示中提供2-8个带有完整推理步骤的示例,让模型模仿。

思考内容的存放位置:
没有独立的“思考”字段。模型输出的推理过程和最终答案全部混在 content 字段中

4.2 推理模型:默认开启,不可关闭

模型将推理能力内置,强制推理,无需提示词唤醒。代表模型:deepseek-r1

思考内容的存放位置:
推理模型将思维链(推理过程)和最终答案分开存放,通过两个独立的字段返回。

字段内容
reasoning_content思维链——模型的内部推理过程
content最终答案
reasoning=response.choices[0].message.reasoning_content answer=response.choices[0].message.content

4.3 当代模型:可开关的思考模式

模型同时具备“直接回答”和“深度思考”两种模式,通过API参数动态切换。代表模型DeepSeek V4 Pro、GPT-5系列

开启方式:
通过 thinking.type 等参数控制思考模式的开关

fromopenaiimportOpenAI client=OpenAI(api_key="<你的API Key>",base_url="https://api.deepseek.com")response=client.chat.completions.create(model="deepseek-v4-pro",messages=[{"role":"user","content":"9.11和9.8哪个更大?"}],# 开启思考模式(必须放在 extra_body 中)extra_body={"thinking":{"type":"enabled"}},# 或 "disabled" 关闭# 可选:控制思考强度reasoning_effort="high"# 可选 high / max)

思考强度控制:
当代模型还支持通过 reasoning_effort 参数控制思考的“深度”

参数值含义
minimal / low轻量思考,响应快,Token少
medium中等思考(默认)
high / max深度思考,准确性高,耗时和Token更多

思考内容的存放位置:
与推理模型一致,思维链通过 reasoning_content 返回,最终答案通过 content 返回

五、总结

维度普通模型推理模型当代模型
代表模型GPT-4、Claude 3DeepSeek R1、OpenAI o1DeepSeek V4 Pro、Claude 3.7、GPT-5
推理开启方式提示词引导默认开启,不可关闭thinking.type 开关控制
思考强度控制无无reasoning_effort 参数
思考内容字段混在 content 中reasoning_contentreasoning_content
是否可关闭不开启就没有不可关闭可关闭

从普通模型到当代模型,我们看到一条清晰的演进路径:推理从“提示词技巧”进化为“内置默认行为”,再进化为“可精细调控的开关” 。不变的是,无论哪种方式,思维链的本质都是让模型不跳过中间的推理过程——只是实现方式越来越优雅、越来越可控。

相关新闻

  • 杰理之麦克风音效流程加入LLNS节点后辅听异常-【篇】
  • qrcode.vue:Vue生态中的专业二维码生成解决方案
  • Three.js 简单碰撞检测教程

最新新闻

  • UnifiedBus性能优化:如何调优异构硬件通信效率
  • sysHAX性能优化秘籍:提升LLM推理吞吐量的7个关键技巧
  • Vue-Giant-Tree:10,000+节点海量数据树形组件的终极解决方案
  • 三步掌握XUnity.AutoTranslator:新手也能轻松上手的Unity游戏翻译完整指南
  • UnifiedBus RMRS资源管理:10个实用技巧优化超节点资源利用率
  • 如何快速掌握Unity游戏翻译神器:XUnity.AutoTranslator完整使用教程

日新闻

  • 【计算机毕业设计案例】基于 Spring Boot+Vue 的电影售票系统设计与实现 前后端分离架构下影院在线购票管理平台(程序+文档+讲解+定制)
  • 到底 TMD 用哪个: npm, pnpm, Yarn, Bun, Deno? 傻瓜, 当然用 npm 啦
  • Google限制Meta使用Gemini模型 凸显AI授权竞争白热化

周新闻

  • Windows字体自定义终极方案:No!! MeiryoUI完全指南
  • Deepin Boot Maker:告别命令行,3分钟制作Linux启动盘的智能解决方案
  • Plain Craft Launcher 2:重新定义你的Minecraft游戏体验

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号