- 你让 AI 改下页面的样式,结果它没搞清楚你到底想干嘛,重新开发了整个布局。
- 你前面明明要求单文件的代码不超过 200 行,结果聊了十几轮之后,AI 把前面的约束给忘了,写了个 1000 行代码的大文件。
- 还有更头疼的,你让 AI 修一个项目里的 Bug,结果又出了 3 个新 Bug,项目都跑不起来了,代码越改越乱。
前两个问题已经有了不少解决办法,比如写好提示词、给 AI 提供充足的信息,但第三个问题就比较棘手了。
如果你想让 AI 做好一个完整的项目,你还得给它搭一整套靠谱的工作环境和工作流程。
这就是最近在 AI 圈很火的 Harness Engineering。
写这期内容前,我看了不少国内外讲 Harness 的教程,很多都花了大量篇幅讲 AI 发展史和枯燥的理论,看完就忘了。所以我换了个思路,先通俗易懂地讲清楚 Harness 是什么,然后带你实战怎么用 Harness 做出完整大项目,还会告诉你怎么最快上手 Harness。
点个收藏,我们开始~
一、快速了解 Harness Engineering
Harness 是什么?
Harness 这个词翻译过来就是「马具」。如果把 AI 模型比作一匹马,那 Harness 就是你驾驭这匹马所需要的一切,比如缰绳、路线规划、围栏等等。
我们要做的,就是怎么让这匹马跑得更快、更稳,顺利完成任务。
具体来说,Harness 就是围绕 AI 模型搭建的一整套工作环境和工作流程。你给 AI 写的项目规则文件、配置的各种工具、安排的任务拆分和执行顺序、设计的测试检查流程,这些统统都算 Harness。
为什么它突然火了?
知名的 AI 框架 LangChain 做了个实验,使用同一个 AI 模型,只优化围绕模型搭建的 Harness 部分,编码基准测试的排名直接从 30 名开外冲到了前 5!
OpenAI 团队也做了类似的尝试。3 个人的小团队,全靠 Harness 引导 AI 生成了上百万行代码,最终做出的产品已经在内部正式上线使用了。
看到这些成果之后,不少知名 AI 公司和技术大佬纷纷写了博客来讲 Harness,于是把这个概念带火了。
有了这些知名公司和大佬的背书,现在行业达成了一个共识:AI 编程的瓶颈不在模型有多聪明,而在你围绕模型搭的这套环境和流程够不够好。
Harness 的发展过程
很多人以为 Harness 是 2026 年蹦出来的新东西。其实从 2022 年 ChatGPT 出来的时候,大家就已经在做 Harness 了,只不过当时没叫这个名字罢了。
为了让你更好地理解 Harness,我先带你简单回顾一下这几年 AI 工程的发展。
1、提示词工程(2022 ~ 2024)
简单来说,就是怎么通过对话让 AI 听懂你的需求。
我们学着给 AI 设定角色、约束输出格式、用思维链让它一步步思考、给几个示例让它模仿。这些技巧虽然简单,但确实能让 AI 的输出质量提升一大截。
2、上下文工程(2025)
在提示词工程的基础上更进一步,核心是怎么在对的时候把对的信息喂给 AI。
比如写 AGENTS.md 规则文件让 AI 了解项目背景,用 RAG 让 AI 能检索到相关资料,对过长的上下文做压缩和摘要,甚至给 AI 建立跨对话的记忆机制,让它不会聊着聊着就断片儿。
3、Harness Engineering(2026)
在上下文工程的基础上又往前走了一步。除了关注给 AI 提供什么信息,还要关注给它配什么工具、大任务怎么拆分成小步骤分批完成、出了问题怎么自己检查和修复、怎么防止代码质量随着迭代慢慢下滑。让 AI 不只是回答问题,而是持续靠谱地完成整个任务。
你会发现,三者是层层包含的关系。
- 提示词是最内层,关注的是「怎么给 AI 下指令」
- 上下文包裹着提示词,关注的是「怎么给 AI 提供信息」
- Harness 把它们全部包在里面,关注的是「怎么让 AI 持续靠谱地干完一整件事」
业界总结了一个公式:Agent = 模型 + Harness。
也就是说,围绕 AI 模型搭建的工具、规则、流程、检查机制,全都属于 Harness 的范畴。