对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
AI协作范式|Anthropic|OpenAI|Harness Engineering|Mitchell Hashimoto|AI智能体|人工智能
2026年2月5日,一篇没有配图、没有公式、甚至没有AI生成痕迹的纯手写博客,在两个月内搅动了整个AI圈。OpenAI、Anthropic先后跟进,软件工程教父写了深度分析,各大AI社区同步刷屏。这篇博客的作者是Mitchell Hashimoto——一个你可能没听过名字,但全球开发者每天都在使用他作品的人。他靠写代码工具白手起家,拒绝过2000万美元收购,后来公司以64亿美元被IBM收购。这次,他用一篇博客定义了AI Agent工业化的全新范式:Harness Engineering。为什么一个‘局外人’的思考,能让整个行业集体转向?
要理解Harness Engineering的革命性,得先回到AI协作的原点。最初,人们靠Prompt Engineering——也就是给模型写‘完美指令’,优化单次对话的输出质量。这就像给马喂最合口的草料,让它跑好每一步,但没法控制它跑向哪里。
接着是Context Engineering,开始管理模型能‘看到’的信息范围:比如给它项目文档、历史对话,让它理解任务背景。这相当于给马指了方向,但马还是可能跑偏、偷懒,或者在复杂路况下失控。
Harness Engineering则是给马套上了一套完整的马具——缰绳控制方向,马鞍稳定重心,脚镫辅助发力。它不关心单次指令写得好不好,也不纠结给模型看了多少资料,而是搭建一个让AI Agent能稳定、持续、安全工作的‘系统场域’:包括任务拆分规则、自动验证工具、错误反馈循环,甚至是Agent的行为边界。

简单说,前两种方法是‘让AI做好一件事’,而Harness Engineering是‘让AI能持续做对事’。
OpenAI的百万行代码实验,把Harness Engineering的价值钉在了地上。2025年,3人团队用Codex Agent从零开始写出100万行生产代码,合并1500个PR,开发速度是手写的10倍。
他们的核心不是靠更强大的模型,而是搭了一套‘不会让模型失败’的Harness:
最有意思的是成本权衡——Anthropic的三Agent架构做游戏,成本是单Agent的20倍,但输出质量从‘不可用’跃升到‘完整可玩’。这正是Harness的核心逻辑:用系统复杂度换结果可靠性。

Harness Engineering不止是技术变革,更是工程师角色的彻底翻转。
过去,工程师是‘代码生产者’,靠双手一行行写出逻辑;现在,工程师成了‘规则设计者’——定义系统的目标和不变量,搭建验证体系,给Agent画好行为边界。代码生成、Bug修复、性能调优这些重复性工作,全交给Agent去做。
Mitchell Hashimoto自己就是最好的例子:他每天下班前30分钟启动Agent,让它在后台处理搜索开源库、批量扫描Issue这类耗时的琐事,第二天早上一坐下就能直接接手成果。他甚至关掉了Agent的通知提醒——控制权必须在人类手上,不能让AI打断自己的深度思考。
当然,这也带来了新挑战:比如Agent可能会‘遗忘’隐性知识,或者在边界条件下出错。OpenAI的解决办法是把团队文化、设计原则、历史决策全部结构化存进代码库,让Agent能随时读取;而Anthropic则给Agent加了‘权限锁’,敏感操作必须人工授权。
当我们谈论AI Agent的未来时,很容易陷入‘模型越强大越好’的误区,但Mitchell Hashimoto的博客给了行业一记清醒的提醒:真正让AI走进工业生产的,从来不是最聪明的模型,而是最可靠的系统。
Harness Engineering的本质,是用人类的工程智慧,框住AI的不确定性。它没有把AI捧成无所不能的‘神’,而是把它变成了需要被正确使用的‘工具’——就像Mitchell Hashimoto一辈子在做的那样:造工具,然后用对工具。
缰绳比马更决定方向。 这句话,或许是AI工业化时代最朴素也最深刻的注脚。