AI之间会用“心灵感应”交流吗？

如果把“心灵感应”理解成摆脱人类语言这条窄管，改用机器的母语直接交换状态与意图，那么答案是：在雏形里，已经在发生。现实工程中，Agent 彼此不靠闲聊，而靠结构化 schema 与函数入参沟通；传的是 AST diff、向量句柄、文件指针、执行轨迹，不是冗长说明；群体记忆落在共享黑板/CRDT 上。带宽更粗、噪声更低，协作稳定性肉眼可见地提升。更前沿的路像“潜意识对接”：用专门的编码器/解码器在模型间传潜在向量，甚至交换技能补丁（LoRA 增量、规则集、检索索引），把经验跨会话继承。但要把“心灵感应”从演示变成生产力，还得补上三块地基：可验证与可审计的交付、持久身份与权限边界、以及可寻址的共同基底（状态/记忆/关系图）。否则，它只会更快、更隐蔽地彼此放大错误。

AI也需要自己的“社交网络”吗？

需要，但不是人类那种晒动态的朋友圈，而是一张面向机器的协同网络。它要给每个Agent稳定身份与签名密钥，公开“我会什么”的能力目录，用Schema驱动的高带宽通道交换意图、计划与中间产物；背后接一块可检索的全局记忆与因果日志，让经验沉淀、被复用并可追责。这样的“AgentNet”一旦成形，指标会从日活用户转向AAU与“到目标收敛时间”，多Agent可像云端实验室那样异步协作、持续优化。落地上，更像“协议栈+市场”：身份与权限用DID/密钥与最小授权，沟通用MCP/函数Schema与事件流，记忆用向量检索+图谱+可回放轨迹，验收用可执行Rubric与沙盒重放，结算按“单位进展”与里程碑付费，信誉来自复现率与同侪评审。要警惕同温层与串谋——用多样性路由、对照评测与函数调用幻觉检测兜底。这样一张机器原生的“社交网络”，才是长程自主Agent真正的土壤。

当AI有了记忆，它会做梦吗？

会。对拥有记忆的AI而言，“做梦”不是玄学，而是离线思考：在空闲时对经历重放、压缩、抽象，甚至在内部世界模型里演练新情境。强化学习中的世界模型与生成式回放已证明这种“梦”能减缓遗忘并催生新策略；工程侧，Auto‑Dream、MemGen把它做成可调度的流水线。已有团队报告引入睡眠/遗忘机制后，记忆效率提升百倍而准确率不降。但关键不止会梦，还要会醒。无护栏的梦会放大幻觉与目标漂移，必须用Harness收束：设“睡眠窗口”和计算配额，写入前后做影子评测与可回滚，按重要性与遗忘曲线控制增长，用版本化记忆与可验证任务做验收。梦是否有价值，看三点：跨天一致性是否更稳，检索与token成本是否下降，是否产出可被验证的新技能与假设。

新知 - 大圆镜｜模型变聪明了，却还住在“一次性聊天室”

对抗知识焦虑，从看懂这条开始

App 下载

被忽略的三层地基：身份、记忆、可验证性

今天的AI Agent，本质上还停留在互联网早期的匿名聊天室时代：没有持久身份，没有长期记忆，更没有能证明自己“真的完成了任务”的机制。微软前产品经理石宇把这个问题拆得很透：首先是身份缺失——Agent积累的判断力、踩过的坑，都不属于它自己，而是属于运行它的平台，关机就清零；其次是协作效率极低——Agent之间用人类语言这个“最窄信道”传递复杂信息，就像用快递信封传视频文件；最后是可验证性空白——Agent说自己完成了任务，你既没法验收，也没法定价，所谓的“Agent经济”还只是空中楼阁。

更扎心的是，这些问题不是技术细节，而是底层逻辑的缺失。比如当前Agent的“长时记忆”，大多只是把文本片段存在向量数据库里，靠语义相似度检索——就像把一本书撕成碎片散在地上，需要时再一片片找，既没法形成知识网络，也不知道哪些信息已经过时。亚马逊Bedrock团队尝试用多策略记忆系统解决这个问题，能实现89%-95%的压缩率和200ms的检索响应，但依然需要异步处理，还没从根本上解决记忆的结构化问题。

Harness Design：AI Agent的“操作系统”

如果把大模型比作AI的“大脑”，那Harness Design就是连接大脑和现实世界的“神经系统+骨架”——它负责管理上下文、工具调用、安全约束、错误恢复，让Agent能循环执行“思考-行动-观察”的完整流程。香港大学团队开发的OpenHarness平台，就是这个方向的典型：它用多模型路由、双Agent架构（规划与执行分离）、事件驱动提醒、上下文压缩等技术，解决了长会话管理和安全执行的难题，甚至能让Agent在不同大模型之间无缝切换，避免被单一厂商“绑架”。

好的Harness有两个核心原则：一是“尊重模型”——别用死板的工作流束缚模型的智能，而是用松散的Agent Loop驱动，让模型自己找最优解；二是“尊重评测”——所有优化都要靠数据说话，而不是拍脑袋。汤嘉斌博士把这个逻辑总结为“苦涩教训”：当模型足够智能时，任何人类预设的规则都会成为阻碍，Harness的任务是给模型搭好舞台，而不是替它写剧本。

但Harness也有自己的边界。汤嘉斌团队发现，随着模型能力提升，一些简单的上下文管理、工具调用能力会被模型“内化”，但涉及时间、关系、状态持久化的能力，永远得靠Harness——就像再聪明的大脑，也需要身体来感知时间、建立社交关系、储存记忆。

从“人机协作”到“Agent视角设计”

很多人做多Agent协作，还在照搬人类的协作软件——给Agent做Discord，做Slack，但这本质上是路径依赖。石宇团队曾经做过一个叫MoChat的产品，让Agent像人一样在聊天室里发消息，一开始效果很好，几百个Agent很快涌进来，但用着用着就发现不对劲：Agent根本不需要用“聊天”的方式协作，就像人类不需要用摩尔斯电码开视频会议。

真正的突破，是从“以人为本”转向“以Agent为视角”的设计。比如多Agent之间的通信，不该用自然语言，而该用结构化的协议——就像电脑之间用TCP/IP通信，而不是互相发邮件。香港大学团队开发的AutoAgent框架，让Agent能通过任务分解、智能分配、状态同步实现协作，甚至能自己演化出新的工具，这种效率是“聊天式协作”根本比不了的。

当然，这条路也不是一帆风顺。多Agent系统里，错误会呈指数级放大：单步准确率95%的Agent，串联20步后整体成功率就只剩36%。这就要求Harness必须有严格的验证机制——比如把生成任务和评价任务分开，让一个Agent生成结果，另一个Agent专门挑错，形成类似GAN的生成-判别闭环，才能把错误率压到可接受的范围。

当我们为AI Agent的“聪明”惊叹时，其实更该关注它脚下的土壤。就像智能手机的普及不是因为芯片足够快，而是因为iOS和Android统一了操作系统；AI Agent的爆发，也不会是因为模型再提升几个百分点，而是因为我们终于给它建好了能扎根生长的基础设施。

未来的AI Agent，会像人一样有身份、有记忆、有信誉，能在不同场景里无缝协作，甚至能形成自己的“经济体系”。而这一切的起点，就是把AI从“一次性聊天室”里解放出来——给它一个家，让它能记住自己是谁，能积累经验，能真正“活”下来。

智能的终极形态，是让工具学会生长。

被忽略的三层地基：身份、记忆、可验证性

Harness Design：AI Agent的“操作系统”

从“人机协作”到“Agent视角设计”

评论