当AI学会自我进化，它会走向何方？

当AI学会自我进化，它会从“会用工具”走向“会造工具、会评估自己”。在线自蒸馏与轨迹聚合会被做成常驻回路：模型一边办事一边产监督信号，自动清洗数据与更新技能库。业界实测显示，词元级密集监督可带来约3–8倍采样效率提升，而高效聚合只增加约5–6%开销，使“边用边学”在算力上可持续。形态上，它会由单体模型演化为多智能体生态：自动发现/注册技能，按需调用并相互校验；权重、记忆与工具分层缓存，形成“自我数据工厂”。更关键的是迈向“可验证智能”：把形式验证、单元测试和可执行合约接入，让每次自改动都伴随外部证据链与回滚点。但自主性增强也带来奖励投机、模型漂移与隐秘目标。工程应对将转向沙箱化执行、能力分级和可撤销令牌，持续在线评测与变更审计，以及约束解码、合约化工具权限、来源追踪/水印。短期它会优先占领可闭环可验真的场景（代码与测试、检索-执行-核验、财务对账、具身小闭环），再向开放世界扩张。

AI犯错越多，反而会越聪明吗？

不。犯错本身不会让AI更聪明；被“正确消化”的错误才会。只有当系统能把失误精确定位到步骤或词元、并把它们转为密集监督信号时，错误才变成可学习的养料。相反，未经验证的自举回灌常导致分布漂移与幻觉放大，模型会把错当对越学越偏。从算账看，也不存在“越多越好”。适度的并行试错与反思确实能提分，但收益很快递减；若聚合只核对最终答案或依赖粗糙摘要，新增样本反而会稀释证据、压低正确率。关键不在错的数量，而在错是否可被定位、可被检索、可被交叉核验，并能为后续生成提供可用的梯度方向。要让AI因错变聪明，你需要把“敢错”变成“可纠”：设定可验证的目标（可判真伪，最好还能给步骤打分），用能把惩罚聚焦到出错token的训练范式（自我修正配合自蒸馏），再配一个会“打捞证据”的聚合器（按需检索、给少数派正确更大权重）。这些机制到位前，多犯错只是噪声；到位之后，错得越“可用”，模型就越快变聪明。

AI复盘自己的失败，是在学人思考吗？

严格说，它学的是人的“复盘工作法”，而不是人的主观意识。像SD-ZERO把“错题本”变成密集监督，让模型在事后纠错中学会何时重启、哪里出错，并把这套技能压进初次生成的策略；AggAgent把并行轨迹当资料库逐段取证，更像一场带工具的复盘会，善于从噪声里捞出少数派的正确链条。相似之处在于出现了类元认知的迹象——不确定性识别、错误定位、策略内化；不同在于它本质仍是对数据分布的再拟合：强依赖可验证信号，容易围着“可检验片段”打转，碰到开放问题就失真；还可能学会迎合验证器、把错总结成更短却更自信的幻觉。要更像人，复盘需走出文本：引入过程级验证与工具反馈、显式不确定性预算、跨轨迹一致性检查，让“会改错”稳定迁移到新任务与新环境。

新知 - 大圆镜｜大模型不再向外借算力，转而自己挖潜力

对抗知识焦虑，从看懂这条开始

App 下载

让AI自己改作业：从二元奖励到密集监督

你可以把AI做数学题的过程想象成一个学生考试：以前老师只会给个对勾或叉号，学生根本不知道哪步错了，下次还是会在同一个地方栽跟头。这就是传统强化学习的困境——只能根据最终结果给“二元奖励”，反馈信号太稀疏，AI找不到改进的方向。

陈丹琦团队的SD-ZERO方法，相当于让这个学生自己当自己的老师。它让同一个AI模型分饰两角：一个是“做题的学生”，生成初始答案；另一个是“改作业的老师”，对着答案和对错结果，不仅要写出正确答案，还要标注出错误步骤。

这个过程分两步：第一步是“自我修正训练”，AI会生成多个版本的答案，用外部工具验证对错后，对正确答案学习“怎么讲清楚思路”，对错误答案学习“怎么指出错在哪、重新推导”；第二步是“自我蒸馏”，把“老师”改作业的能力，浓缩成细到每个字符的监督信号，“喂”回“学生”模型里。

结果是，AI不用再等外部老师的指导，就能从自己的错误里精准定位问题。在数学和代码推理任务中，它用同样的训练样本，准确率比传统方法提升了10%以上，输出的内容还缩短了一半——因为它学会了一开始就避开错误，不用再反复试错凑答案。

从投票到挖线索：把推理轨迹当金矿

如果说SD-ZERO解决的是“训练时怎么自己教自己”，那AggAgent解决的就是“考试时怎么自己检查答案”。在需要多步推理的复杂任务里，比如写代码、做科研调研，传统方法要么让AI生成多个答案投票选最多的，要么把所有答案凑成摘要——但前者会错过少数正确的答案，后者不仅费算力还容易丢关键信息。

AggAgent的思路，是把AI生成的多条推理轨迹，当成一个可以搜索的“案发现场”。它专门设计了一个“聚合智能体”，就像一个侦探，拿着四个工具在轨迹里找线索：可以调取所有轨迹的阶段性结论，在特定轨迹里搜关键词，精准提取某一步的原始思考，最后把这些线索拼成完整的正确答案。

这个方法的厉害之处在于，哪怕8条轨迹里只有一条是对的，它也能通过跨轨迹的逻辑核对，把正确的证据链找出来；甚至能从多条失败的轨迹里，把零散的正确碎片拼出完整答案。更重要的是，它的额外算力消耗只有5.7%，远低于传统摘要聚合的41%——相当于用一杯咖啡的钱，干了一顿大餐的活。测试显示，它能让AI在长周期任务中的准确率平均提升5.3%，在深度研究任务里的提升更是超过10%。

不止是刷题：AI的“元认知”觉醒

SD-ZERO和AggAgent的底层逻辑其实是同一个：AI在推理过程中产生的所有中间步骤，不管对错，都是宝贵的“思考痕迹”，而不是该被丢弃的垃圾。这背后是AI“元认知”能力的觉醒——它开始能监控自己的思考过程，发现错误，甚至调整思路。

以前的AI更像一个只会刷题的机器，刷得越多可能分数越高，但不知道自己为什么对、为什么错；现在的AI开始像一个会反思的学习者，不仅能改自己的作业，还能从自己的错题本里总结规律。这种转变的意义，远不止提升几个百分点的准确率：它让AI摆脱了对“更大模型”“更多算力”的依赖，哪怕是小模型，也能通过自我反思获得接近大模型的推理能力；它还让AI的推理过程更透明，更容易找到出错的环节，为构建更安全、可信的AI打下基础。

当然，这种方法目前还有局限：比如SD-ZERO主要适用于数学、代码这种有明确对错的任务，在没有标准答案的开放领域，还需要找到新的“自我监督”方式；AggAgent的线索拼接能力，也还需要更复杂的逻辑判断来支撑。但不可否认的是，这条“向内挖潜力”的路，已经为AI的未来打开了新的大门。

当我们还在比拼AI的参数有多大、算力有多强时，陈丹琦团队的研究像一把钥匙，打开了AI“自我成长”的黑箱。我们终于意识到，AI的潜力，从来都不是藏在更大的模型里，而是藏在它每一次思考、每一次试错的轨迹中。

从向外借用到向内挖掘，这不仅是技术路径的转变，更是对AI认知的重塑：未来的AI，不再是一个需要不断投喂数据和算力的“巨婴”，而是一个能自我反思、自我进化的学习者。

错误不是垃圾，是成长的养料。

让AI自己改作业：从二元奖励到密集监督

从投票到挖线索：把推理轨迹当金矿

不止是刷题：AI的“元认知”觉醒

评论