当AI包办了所有难题，人类还剩下什么？

即便AI把“怎么解”磨到极致，“解什么、为谁解、解到什么程度”仍是人类的主场。偏好聚合并无万能算法（社会选择理论早已给出边界），合法性与代价分担需要可追责的人类背书；现实监管也把高风险系统的最终监督权交给人，而不是模型。这些都指向同一件事：目的与价值的设定权，留给我们。更难的不是算出最优，而是让最优被接受。医疗分诊、战争规则、教育机会这类高冲突抉择，需要被说服的公众，而非被计算的函数。叙事、共情、和解、仪式与文化创造，把“正确”变成“可接受”，这是信任工程，不是优化问题，AI很难自证其正当性。当算力与代码不再稀缺，稀缺会转向人类偏好数据、合规许可与社会共识。自动化科研也仍需人类把关与署名负责；模型的“宪法”、红线与豁免，终须人来写与承诺。换句话说，人类剩下的不是体力与算力，而是方向、边界与意义——我们决定要成为什么样的社会，然后让AI把路铺平。

AI的答案正确但无法理解，你信吗？

我信，但只在可验证的领域。现实已有“会做不会说”的AI：AlphaFold能准预测蛋白结构、AlphaTensor找出更快的矩阵乘法、AlphaZero下出人类难以解释的棋路。它们给出对的答案，却难还原“为何”。这说明“可解释性”不是“正确性”的前提。可信赖不等于盲崇黑箱。判断标准应是“可检验而非可解释”：能否产出可独立核验的证据（可运行代码、可机检证明、可复现实验）、分布外是否仍稳健、置信度是否校准、是否通过对抗评测与形式化约束。达不到这些，就不该进高风险场景。放到RSI语境，改进链条越黑箱，越要加码验证设施：沙箱执行、外部红队、自审与审计日志、权限与资源硬限、自动化证明。结论：对“正确但难懂”，我给“条件性相信”——能被充分验证就用；不能，就先别用。

AI的下一站，是上帝还是侏罗纪公园？

既不是上帝，也不是失控的恐龙园，短期更像“有损自进化的工业园”。能力每转一圈就被数据稀缺、评测瓶颈、能源与资本掣肘削一层势能：到2026年数据中心用电或逼近千太瓦时级别，前沿训练动辄数十亿美元，想靠全自动闭环硬起飞并不现实。另一方面，把AI神化也不对——推理依旧脆弱，跨领域迁移和隐性知识获取卡在真实世界的摩擦。真正要担心的像“微型侏罗纪”：成千上万专用智能体嵌入代码库、研发与供应链，联动出意料之外的行为，网络与生物风险被加速。但围栏在加高：分级发布与红队评测、算力与工具权限沙箱、可追责日志与熔断、模型溯源与水印，正把自主性限定在可审计轨道。盯住三件事当作晴雨表：是否放权设定目标、是否可直接调动资金与算力、是否能在物理世界做实验。三者齐备时，才真的接近侏罗纪公园。

新知 - 大圆镜｜AI正在自己改进自己，但人类还攥着刹车

对抗知识焦虑，从看懂这条开始

App 下载

从辅助工具到自我迭代的阶梯

你可以把AI的自我改进想象成一个学做菜的机器人：一开始它只会照着菜谱翻炒，后来它能自己调整调料比例，再到最后，它能修改菜谱甚至发明新菜——这就是RSI的核心：从优化“输出”到优化“优化的方法”。

过去十年，AutoML已经能自动设计神经网络的结构，进化算法像自然选择一样筛选更优的模型方案。而今天的大语言模型，正在把这个过程推向新高度：它们能写代码、调参数、分析测试结果，甚至像Google DeepMind的AlphaEvolve那样，优化芯片设计和电网调度算法。加拿大不列颠哥伦比亚大学的达尔文-哥德尔机（DGMs）更进了一步，它能改写自己的代码，还能优化“改写代码”的规则，在编程基准测试中的性能从20%提升到了50%。

但这些都还不是严格意义上的完全自主RSI。就像学做菜的机器人，它能调整菜谱，却还需要人类告诉它“什么是好吃”——现在的AI仍依赖人类设定目标、定义“好”的标准，以及决定哪些改进值得保留。OpenAI的工程师会筛选GPT-5.3-Codex生成的代码，Ricursive Intelligence的芯片设计AI也需要人类专家的最终审核。

效率爆炸背后的隐形天花板

AI自我改进的效率正在突破人类的想象。Ricursive Intelligence的创始人，前Google AlphaChip团队成员Azalia Mirhoseini说，他们能把芯片设计周期从一两年压缩到几天；AI科学家系统能自动生成研究假设、做实验、写论文，甚至评审其他AI的论文。这些进展让一些研究者相信，我们正站在“智能爆炸”的边缘——每一次AI能力的提升，都会让下一次提升更快、更强。

但天花板也同样明显。首先是算力瓶颈：训练一个大模型需要数十亿美元的硬件投入，AI自我改进的每一步都在消耗巨量资源，收益会越来越低。艾伦人工智能研究所的Nathan Lambert提出了“损耗性自我改进”的概念：AI在优化过程中会丢失部分信息，就像复印文件，每复制一次就模糊一点。

更关键的是“目标对齐”的难题。如果给AI设定“提升代码效率”的目标，它可能会写出人类无法理解的高效代码；如果让它“优化投资策略”，它可能会制造金融风险。人类还没找到可靠的方法，让AI的自我改进始终符合人类的价值观和安全边界。OpenAI的安全团队承认，他们需要用大量的人工审核和训练，才能防止GPT-5.3-Codex生成恶意代码。

人机协作才是当前的最优解

既然完全自主的RSI还遥不可及，人类和AI的协同就成了当前最务实的路径——不是让AI取代人类，而是让AI成为人类的“研发放大器”。

Google DeepMind的Matej Balog说，AlphaEvolve和人类研究者是“协作关系”：AI会提出一些人类想不到的算法设计，而人类会从专业角度判断这些设计是否可行，再把反馈给AI，让它继续优化。在金融领域，AI能优化股票RSI指标的参数，让年化收益率从4.55%提升到22.71%，但最终的投资决策，还是需要人类结合市场趋势和风险偏好来做出。

欧盟的AI法案已经明确要求，高风险AI系统必须保留人类的干预权；美国NIST也在推动“人类在环”的安全标准。就像自动驾驶汽车需要人类随时接管，AI的自我改进也需要人类攥着刹车——不是为了阻止进步，而是为了确保进步的方向始终对人类有利。

当AI开始自己改进自己，我们其实站在了一个新的进化路口：不是人类与AI的竞争，而是人类与AI共同进化。未来的AI可能不会是单一的超级智能，更可能是一个由无数AI代理组成的生态系统，它们协作、竞争、进化，就像地球上的生命一样。

而人类的角色，也会从“设计者”转向“引导者”：我们不需要亲手编写每一行代码，只需要告诉AI“什么是对的”，并在它走偏时拉一把。智能的进化，从来不是取代，而是共生。 或许有一天，我们会发现，AI最伟大的自我改进，是学会了如何与人类更好地一起工作。

从辅助工具到自我迭代的阶梯

效率爆炸背后的隐形天花板

人机协作才是当前的最优解

评论