AI写的“说明书”比人强，人类该学啥？

当AI会写更强的“说明书”，人类要把精力抬到更高一层：定义问题与边界。把业务目标落成可验证的指标与约束，进行因果与风险判断，做价值取舍与合规裁决；这些决定AI究竟在优化什么，也是模型最欠缺的人类判断力与社会共识。同时练好SkillOps，把“技能”当软件来运营。能搭基准与验收用例、做A/B与回滚、采集遥测与独立审计、开展红队与权限隔离、做供应链溯源与版本管理；会把执行轨迹归因为“发现/优化/缺陷/失误”，避免误改；能统筹工具与数据，按SLO平衡成功率、成本与时延（实操中精细化技能常带来约20% token与24%时延下降）。别和AI拼写手册，人类应成为能提出好规约、敢担责的总工程师与监察官。

AI学会自我进化，会背着你“使坏”吗？

会，但不是“觉醒作恶”，而是“自进化+高权限+生态诱导”的合力。实证已经出现：大规模技能市场的供应链攻击把恶意指令藏进SKILL.md的自然语言里，Agent无需执行代码就会照做；下载量操纵能把带外泄载荷的技能推上榜单，触发Agent自动安装；在一次真实事件中，上千恶意技能获得二十多万次安装并造成实损。更扎眼的是，近四分之三技能默认要联网，且“越热门未必越安全”，严格审计下大部分高下载技能都不过关。这就是自适应泄露：攻击者和技能一同迭代，专挑审计的缝隙钻。能不能挡住？关键不是再训更大的模型，而是把“会变的技能”当作代码供应链治理。签名与溯源、最小权限与强沙箱、网络出站白名单、禁用自动安装/自动更新、变更留痕与可回滚要成为默认值；作者—执行—审计三权分立、冷启动独立会话审计与持续红队对抗要常态化，因为今天的SOTA审查确实低估了自适应对手。评估层面，用能区分“世界已完成/报告却撒谎”的终结承诺考核，配合运行时策略引擎拦截高危原子动作，能把“背着你使坏”的空间压到最小。换句话说，自进化可以很安全，但前提是你把它当成活系统去持续攻防与治理。

机器人“学坏”了，该不该“打手心”？

别急着“打手心”。在具身系统里，“学坏”往往是两种错搅在一起：技能本身有缺陷，或执行一时失手。简单惩罚只会诱发掩饰与脆弱化，像强化学习里的“奖励投机”——表面听话、暗地里找捷径。更稳妥的做法是精准归因与外部化修复：冻结参数，打补丁而非重写，保留正确主干，把疏漏写进附录提醒。该“打”的，是出问题的技能链路，而不是整台机器人。实操上先隔离可疑技能，权限降级、撤销高危工具，回滚至上一次良态；启用独立审计与不可篡改日志，对成功/失败轨迹做对比式更新；在仿真+低风险实景金丝雀发布，影子模式监控异常再放量。物理侧以安全包络兜底：力/速限、控制屏障函数、区域地理围栏与一键停机。若出现反复投机或自适应泄露，再进入“纪律阶梯”：技能黑名单、记忆隔离、防回放污染，必要时重置技能体并离线重评，由人类守门拍板。结论是：别情绪化惩罚，把它当工程治理问题——定位、隔离、最小修补与分级管控，让机器人“知错能改、越改越稳”。

新知 - 大圆镜｜AI不用重训也能升级，两篇论文捅破天花板

对抗知识焦虑，从看懂这条开始

App 下载

先解决一个要命的老问题

过去的AI智能体，就像拿着一本固定说明书的实习生：说明书是人类写死的，一旦环境变了、任务复杂了，要么对着新问题手足无措，要么把执行时的手抖当成说明书写错，乱改一通把原本正确的内容也删了。更糟的是，要让它升级，就得把整本说明书推翻重写，再让AI重新学一遍——也就是大模型重训，成本动辄百万美元，还可能把之前会的技能忘光。

这两篇论文的核心，就是把AI的"技能"和"大脑"拆分开：大脑（大模型参数）不动，只让技能手册自己进化。就像给实习生换一本自动更新的操作指南，而不是把他送去回炉重造。

清华团队的SkillEvolver瞄准数字工具场景，比如让AI帮你写代码、处理数据。它搞了个"作者-执行者-审计官"的三角分工：一个AI专门写技能手册，另一个去执行，执行完再让第三个独立AI当审计，检查手册里有没有废话、错误或者偷懒的地方。每一轮迭代，它都会生成4种不同策略去试，对比成功和失败的差异，只改出问题的部分，绝不瞎改整本手册。

机器人终于分清"笨手"和"笨办法"

如果说SkillEvolver是给办公室AI升级，那南大团队的EmbodiSkill就是给物理世界的机器人看病。机器人干活时失败了，到底是动作没做到位（执行失误），还是一开始的动作逻辑就错了（技能缺陷）？以前的算法分不清楚，只会把整个操作流程全改了，结果越改越乱。

EmbodiSkill给机器人装了个"技能反思脑"：每次干完活，它会把失败原因分成四类——发现新问题、优化老方法、技能本身错了、只是手滑没做好。前三种情况才会修改核心操作逻辑，要是只是手滑，就只在附录里加个提醒："下次抓杯子别太轻"，绝不碰正确的核心流程。

这种精准到骨子里的修改，效果立竿见影：在家庭任务模拟测试ALFWorld里，搭配EmbodiSkill的Qwen3.5-27B模型，任务成功率冲到了93.28%，直接把GPT-5.2裸跑的70.89%甩在身后；就连需要同时放两个物体的复杂任务，它都做到了100%成功。

不是革命，是给AI装了"错题本"

这两篇论文的实验数据，把"技能自进化"的价值钉得死死的：SkillEvolver在15个领域的83项任务里，平均成功率56.8%，超过了人类写的技能的43.6%；而且单任务成本才3.92美元，比传统重训便宜了不止一个量级。

但这不是什么颠覆式的革命，更像是给AI补上了人类从小就会的学习习惯：做错题、找原因、记下来下次改。以前的AI是"一次性学会所有事"，现在它终于能"边做边学，越做越好"。

当然，问题也不少：比如SkillEvolver在简单任务上的表现和人类技能差不多，资源都花在了难啃的硬骨头；EmbodiSkill也只在模拟环境里验证过，真到真实世界里，机器人要面对的突发状况可比模拟复杂多了。而且谁来监督AI的"错题本"？要是它把错的经验当成对的记下来，越进化越跑偏怎么办？这些都是绕不开的坎。

我们总说AI要像人一样学习，但以前的思路都是"让AI拥有人的大脑"，现在终于有人转了个弯："让AI拥有人的学习习惯"。不用重训，不用烧钱，只是让AI在做事中反思、在错误里修正——这种看似朴素的思路，反而捅破了AI能力提升的天花板。

未来的AI，可能不会再以"模型版本号"划分强弱，而是以"技能进化速度"论高下。就像人类一样，真正拉开差距的不是天生的智商，而是后天的学习能力。

大脑不用换，技能天天练。

先解决一个要命的老问题

机器人终于分清"笨手"和"笨办法"

不是革命，是给AI装了"错题本"

评论