对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
记忆机制|身份管理|操作系统|Harness Design|AI Agent|AI智能体|人工智能
你可能已经见过AI Agent写出惊艳的方案,或是调用十几款工具完成复杂任务——但很少有人注意到,这些聪明的Agent其实活在“一次性聊天室”里:每次会话结束,它就忘了自己是谁,忘了昨天踩过的坑,甚至忘了上一秒刚说过的话。当大模型的能力曲线以指数速度爬升,我们突然发现:真正的瓶颈早已不是模型不够聪明,而是我们根本没给这些聪明的模型准备好扎根生长的土壤。这正是AI行业最近半年疯狂讨论Harness Design的原因——我们得给AI Agent建一套真正能用的“操作系统”了。
今天的AI Agent,本质上还停留在互联网早期的匿名聊天室时代:没有持久身份,没有长期记忆,更没有能证明自己“真的完成了任务”的机制。微软前产品经理石宇把这个问题拆得很透:首先是身份缺失——Agent积累的判断力、踩过的坑,都不属于它自己,而是属于运行它的平台,关机就清零;其次是协作效率极低——Agent之间用人类语言这个“最窄信道”传递复杂信息,就像用快递信封传视频文件;最后是可验证性空白——Agent说自己完成了任务,你既没法验收,也没法定价,所谓的“Agent经济”还只是空中楼阁。
更扎心的是,这些问题不是技术细节,而是底层逻辑的缺失。比如当前Agent的“长时记忆”,大多只是把文本片段存在向量数据库里,靠语义相似度检索——就像把一本书撕成碎片散在地上,需要时再一片片找,既没法形成知识网络,也不知道哪些信息已经过时。亚马逊Bedrock团队尝试用多策略记忆系统解决这个问题,能实现89%-95%的压缩率和200ms的检索响应,但依然需要异步处理,还没从根本上解决记忆的结构化问题。
如果把大模型比作AI的“大脑”,那Harness Design就是连接大脑和现实世界的“神经系统+骨架”——它负责管理上下文、工具调用、安全约束、错误恢复,让Agent能循环执行“思考-行动-观察”的完整流程。香港大学团队开发的OpenHarness平台,就是这个方向的典型:它用多模型路由、双Agent架构(规划与执行分离)、事件驱动提醒、上下文压缩等技术,解决了长会话管理和安全执行的难题,甚至能让Agent在不同大模型之间无缝切换,避免被单一厂商“绑架”。

好的Harness有两个核心原则:一是“尊重模型”——别用死板的工作流束缚模型的智能,而是用松散的Agent Loop驱动,让模型自己找最优解;二是“尊重评测”——所有优化都要靠数据说话,而不是拍脑袋。汤嘉斌博士把这个逻辑总结为“苦涩教训”:当模型足够智能时,任何人类预设的规则都会成为阻碍,Harness的任务是给模型搭好舞台,而不是替它写剧本。
但Harness也有自己的边界。汤嘉斌团队发现,随着模型能力提升,一些简单的上下文管理、工具调用能力会被模型“内化”,但涉及时间、关系、状态持久化的能力,永远得靠Harness——就像再聪明的大脑,也需要身体来感知时间、建立社交关系、储存记忆。
很多人做多Agent协作,还在照搬人类的协作软件——给Agent做Discord,做Slack,但这本质上是路径依赖。石宇团队曾经做过一个叫MoChat的产品,让Agent像人一样在聊天室里发消息,一开始效果很好,几百个Agent很快涌进来,但用着用着就发现不对劲:Agent根本不需要用“聊天”的方式协作,就像人类不需要用摩尔斯电码开视频会议。
真正的突破,是从“以人为本”转向“以Agent为视角”的设计。比如多Agent之间的通信,不该用自然语言,而该用结构化的协议——就像电脑之间用TCP/IP通信,而不是互相发邮件。香港大学团队开发的AutoAgent框架,让Agent能通过任务分解、智能分配、状态同步实现协作,甚至能自己演化出新的工具,这种效率是“聊天式协作”根本比不了的。

当然,这条路也不是一帆风顺。多Agent系统里,错误会呈指数级放大:单步准确率95%的Agent,串联20步后整体成功率就只剩36%。这就要求Harness必须有严格的验证机制——比如把生成任务和评价任务分开,让一个Agent生成结果,另一个Agent专门挑错,形成类似GAN的生成-判别闭环,才能把错误率压到可接受的范围。
当我们为AI Agent的“聪明”惊叹时,其实更该关注它脚下的土壤。就像智能手机的普及不是因为芯片足够快,而是因为iOS和Android统一了操作系统;AI Agent的爆发,也不会是因为模型再提升几个百分点,而是因为我们终于给它建好了能扎根生长的基础设施。
未来的AI Agent,会像人一样有身份、有记忆、有信誉,能在不同场景里无缝协作,甚至能形成自己的“经济体系”。而这一切的起点,就是把AI从“一次性聊天室”里解放出来——给它一个家,让它能记住自己是谁,能积累经验,能真正“活”下来。
智能的终极形态,是让工具学会生长。