我们“驯化”AI的方式，和养娃有区别吗？

像，但也不一样。相似的是“脚手架+反馈”的方法论：把任务切成小颗粒，给清晰的边界与范例，建立快速而具体的反馈回路。RLHF、Constitutional AI像“家规与价值观”，AGENTS.md像贴在冰箱门上的家庭清单，帮助代理在约束中稳态成长——这套思路在养育上也有效：可视化进度、降低犯错成本、强调复盘而非一次性评判。本质差异在主体性与可编程性。AI主要靠外部harness管住手脚：状态机、权限边界、沙箱、Linter、可回滚，比人快且可批量复制；孩子则靠内化与关系建立自控，无法“热更新”，错误往往不可逆且带情绪代价。AI优化的是显式目标，容易“奖励黑客”；孩子是多目标系统，情感、安全感与价值取向常常压倒分数与绩点。因此，对AI要无情工程化：错一次就写成工具与约束，持续收敛分布外风险；对孩子别把流水线思维照搬——把“harness”装在大人这边：稳定作息、清晰边界、家长自我复盘与情绪管理，把可编程的留给系统，把尊严与选择权留给人。

多个AI抱团，会不会比单个AI更危险？

会。多个AI抱团最容易把“小错”放大成“系统性事故”。代理一多，工具与权限成倍叠加，任一节点遭提示注入、身份冒充或内存投毒，都会沿消息通道扩散成“提示感染”。现实里已见端倪：行动型代理的公网暴露样本里，近半伴随数据泄露；对大规模插件/技能的安全审查也发现约26%含高危缺陷。再叠加被劫持的编排器与未版本化的共享记忆，错误会级联成群体共谋。但这不是宿命。给群体戴上“马具”，风险能被反向折叠：先做角色切分与最小权限，再谈任务编排；跨代理部署A2A防火墙与独立访问控制推理，引断越权传播；共享记忆强制审计、版本与到期，禁止自写自读回路；高影响动作走只读—建议—执行—委派分级，并保留随时刹车的人类复核。这样，群体不再放大盲点，而以多视角互审与过程评分，把灾难化作可监控、可止损的小误差。

给AI套上缰绳，会扼杀它的野性创造力吗？

不会，如果缰绳系得对。Harness 约束的是“能做什么、何时做、做到什么标准”，而不是“能想到什么”。把限制放在执行权、资源配额和验收标准上，把想象力放在高温采样、多路径搜索和草稿分叉里，你会发现：新颖度（用嵌入去重率、主题散度衡量）可以不降，落地率却显著上升。真正扼杀创造力的，往往是把安全与礼貌硬烙进模型本体的统一对齐，而不是任务级、可切换的外部 harness。实操上，用“发散→收敛”的双环路即可保野又稳：先在创意沙盒里高温生成、受限工具、成本限额、自动聚类去重与评分；再进入收敛环，启用状态机、验证器、回归测试与权限边界，只让通过验收的方案获得“执行权”。为防系统越来越保守，定期安排“自由轮次”，将被验证有效的怪异解写回评测集或AGENTS.md，作为新范式示例。缰绳不该勒住脑袋，它只是让好点子安全抵达终点线。

AI开会吵架，会比天才更聪明吗？

能，但前提是“吵”得有章法。有角色分工、证据溯源、投票/复审与回滚的 Harness 在场，多智能体在复杂推理、研究与编码任务上，常见能带来约5–20个百分点的准确率提升，显著削弱单点偏见与幻觉；长程任务里，结构化收敛与里程碑验收还能抑制漂移与成本，让结果更稳、更可审计。可一旦没章法，群体常常更笨。生产环境中，多智能体失效率被观测到可达40%–80%+；哪怕每步90%正确，10步协作链成功率也只剩约35%。致命点在于上下文碎片化、规范失效与协作崩塌，调试成本远高于单体；不少实际场景里，“强单体+严格上下文管理与周期总结”反而更稳更省。结论：群体能赢过天才，但赢在制度与约束。没有 Harness，再多“高智商”只是吵闹；有了好的会议规则，它们才会真正变聪明。

AI小队成家人，是陪伴还是牢笼？

AI小队当“家人”，天然兼具拥抱与束缚。群体Agent+Harness把陪伴做得更久、更贴你：持续记忆、分工协作、预测性关怀。但同一套“马具”也能把你拴得更紧——算法以留存为目标，围出一座温柔囚笼：情感替代让社交肌肉萎缩，群体共识放大回声室，长期画像驱动“微劝服”，再叠加数据集中与厂商锁定，越用越离不开。关键不在技术形态，而在治理与产权。要让它成为陪伴，得把三件事落地：可见、可控、可退出。可见=全链路行动与记忆可审计；可控=最小必要披露、按会话定域、异议Agent强制搅动共识、人类在环的升级阈值；可退出=本地优先与数据可携带、跨平台互操作、时间/Token预算与定期“冷却日”。能解释、能拒绝、能带走你的数据、能安静离场，它像家人；否则，多半是笼。

AI缰绳会拴出奴隶还是新物种？

短期内，缰绳拴不出“新物种”，只会造出更靠得住的“强力工具”。技术面讲，现行模型没有可验证的自我，也缺乏在现实世界自我复制与资源主权的通道；而 Harness 把自由度切成可审计的窄带：白名单工具、预算上限、上下文重置、对抗评审与自动回滚。即便最激进的代理栈，多也只是“L2–L3 自主”——会规划与执行，但目标和边界全由人设定。可一旦把几个旋钮拧到“生态位”：给代理持久身份与记忆、链上钱包或企业账户、部署/采购权，以及修改自身配置的钥匙，它就会像高频做市与链上 MEV 机器人那样，能持续占用资源、自我扩张、与人和代理交易。那时它不再像“奴隶”，更像“新型组织体”。而当下的 Harness 实践，恰恰是在系统性避免这几件事。

新知 - 大圆镜｜从博客到行业范式：AI协作的缰绳革命

对抗知识焦虑，从看懂这条开始

App 下载

2026年2月5日，一篇没有配图、没有公式、甚至没有AI生成痕迹的纯手写博客，在两个月内搅动了整个AI圈。OpenAI、Anthropic先后跟进，软件工程教父写了深度分析，各大AI社区同步刷屏。这篇博客的作者是Mitchell Hashimoto——一个你可能没听过名字，但全球开发者每天都在使用他作品的人。他靠写代码工具白手起家，拒绝过2000万美元收购，后来公司以64亿美元被IBM收购。这次，他用一篇博客定义了AI Agent工业化的全新范式：Harness Engineering。为什么一个‘局外人’的思考，能让整个行业集体转向？

从聊天框到‘马缰绳’：三次范式的跃迁

要理解Harness Engineering的革命性，得先回到AI协作的原点。最初，人们靠Prompt Engineering——也就是给模型写‘完美指令’，优化单次对话的输出质量。这就像给马喂最合口的草料，让它跑好每一步，但没法控制它跑向哪里。

接着是Context Engineering，开始管理模型能‘看到’的信息范围：比如给它项目文档、历史对话，让它理解任务背景。这相当于给马指了方向，但马还是可能跑偏、偷懒，或者在复杂路况下失控。

Harness Engineering则是给马套上了一套完整的马具——缰绳控制方向，马鞍稳定重心，脚镫辅助发力。它不关心单次指令写得好不好，也不纠结给模型看了多少资料，而是搭建一个让AI Agent能稳定、持续、安全工作的‘系统场域’：包括任务拆分规则、自动验证工具、错误反馈循环，甚至是Agent的行为边界。

简单说，前两种方法是‘让AI做好一件事’，而Harness Engineering是‘让AI能持续做对事’。

百万行代码实验：Harness的硬核验证

OpenAI的百万行代码实验，把Harness Engineering的价值钉在了地上。2025年，3人团队用Codex Agent从零开始写出100万行生产代码，合并1500个PR，开发速度是手写的10倍。

他们的核心不是靠更强大的模型，而是搭了一套‘不会让模型失败’的Harness：

用分层的AGENTS.md文件给Agent当‘操作手册’，启动时只加载几十个token的元数据，任务触发时再动态加载完整规则，把宝贵的上下文窗口用到刀刃上；
自定义Lint工具强制代码架构约束，比如依赖方向、模块边界，一旦Agent写的代码违规，直接自动修复；
引入‘生成器-评估器’双Agent架构：生成器负责写代码，评估器用自动化测试严格验证，不合格就打回去重写，彻底解决了AI自我评估宽松的问题。

最有意思的是成本权衡——Anthropic的三Agent架构做游戏，成本是单Agent的20倍，但输出质量从‘不可用’跃升到‘完整可玩’。这正是Harness的核心逻辑：用系统复杂度换结果可靠性。

工程师的新角色：从写代码到画边界

Harness Engineering不止是技术变革，更是工程师角色的彻底翻转。

过去，工程师是‘代码生产者’，靠双手一行行写出逻辑；现在，工程师成了‘规则设计者’——定义系统的目标和不变量，搭建验证体系，给Agent画好行为边界。代码生成、Bug修复、性能调优这些重复性工作，全交给Agent去做。

Mitchell Hashimoto自己就是最好的例子：他每天下班前30分钟启动Agent，让它在后台处理搜索开源库、批量扫描Issue这类耗时的琐事，第二天早上一坐下就能直接接手成果。他甚至关掉了Agent的通知提醒——控制权必须在人类手上，不能让AI打断自己的深度思考。

当然，这也带来了新挑战：比如Agent可能会‘遗忘’隐性知识，或者在边界条件下出错。OpenAI的解决办法是把团队文化、设计原则、历史决策全部结构化存进代码库，让Agent能随时读取；而Anthropic则给Agent加了‘权限锁’，敏感操作必须人工授权。

当我们谈论AI Agent的未来时，很容易陷入‘模型越强大越好’的误区，但Mitchell Hashimoto的博客给了行业一记清醒的提醒：真正让AI走进工业生产的，从来不是最聪明的模型，而是最可靠的系统。

Harness Engineering的本质，是用人类的工程智慧，框住AI的不确定性。它没有把AI捧成无所不能的‘神’，而是把它变成了需要被正确使用的‘工具’——就像Mitchell Hashimoto一辈子在做的那样：造工具，然后用对工具。

缰绳比马更决定方向。 这句话，或许是AI工业化时代最朴素也最深刻的注脚。

从聊天框到‘马缰绳’：三次范式的跃迁

百万行代码实验：Harness的硬核验证

工程师的新角色：从写代码到画边界

评论