AI论文能算谁的？当作者还是当打印机？

结论先说透：在学术界，AI不能当作者。署名=责任，作者必须能对数据来源、方法细节、结论可靠性、版权与利益冲突负责。AI做不到这些签署与背书，因此它在论文里更像“高配打印机+研究助理”：起草、检索、形式化都行，但署名与责权最终落在提出思路、定稿与把关的人类。版权归谁取决于法域。美国强调“人类作者性”，纯AI生成一般不授予版权；英国对“计算机生成作品”把作者定为“做出必要安排的人”；中国多起案件倾向承认有人类选择、取舍与改写参与的AIGC作品可获保护，权利通常归投入并实质控制创作的人。放到数学论文亦然：未经人类验证与重述的机器证明，很难主张学术发表与版权。实操层面，把AI当工具不当作者：如实披露使用场景，保留提示词与版本日志，把“论证路径与结论责任”牢牢握在人类手里。若只是“一键出稿”，既可能拿不到版权，也易踩上抄袭与数据污染红线；当你提供原创构思并完成严肃把关，作者就是你，AI只该出现在致谢里。

AI“证明”了假命题，法律和医学敢用吗？

敢用，但用法得换。高风险领域不再追求“万能模型”，而是“可验证、可回退、可归因”的系统工程。医疗里，大量已获批的AI/ML器械都被限制在窄任务：影像分诊、量测、质控；算法“锁定”，更新走预设变更计划；强制不确定性校准与“不会就拒答”；影子模式跑足真实世界证据，双签审读后再放权。任何闭环处方/治疗，必须保留人类最终决策权、可解释证据链和持续不良事件监测，否则不上线。法律亦然。法院早已接受技术辅助检索（TAR），靠抽样验证的召回/精确度、全链路审计和来源可追溯来“敢用”；相反，生成式起草若无引证与核验，虚构判例如今已被司法处罚。可行路径是：只从白名单知识库检索，逐条给出处，模型默认保守弃答，关键论断需人工背书与责任签名。真正的底线不是“AI会不会犯错”，而是“系统级容错是否可控”。把大模型当同事而非法官/医生：清晰的适用边界与禁用清单、形式化校验（规则引擎/定理验证）、不确定性门控与对抗红队、上线后的实时监控与熔断机制。做到这些，“AI给错答案”会触发报警与转人工，而不是直接变成判决书或处方笺。

AI在拆解旧难题，人类该建什么新大厦？

让AI去拆楼，人类要起的是“形式化科学的摩天楼”。把证明当代码管理：从猜想到定理到审稿，全流程可复现、可回滚、可审计。建立“策略的语言”，把选路、启发式与失败样本一起版本化；配套溯源与相似度雷达，给每个引理打上来源与原创度水印，防住“潜意识剽窃”。其次，搭建“价值判定的最高法院”。评审不再问“能不能做”，而是“值得不值得做”：对AI产出的成千上万条证明，做概念消融与可转用性评测，给“新概念密度”“跨领域可迁移度”计分。建立moonshot池与低垂果实池、预注册猜想与负结果奖励、可计算暴露与训练集披露制度。最后，培养“概念考古学家”和“科学翻译官”。新训练目标不是手算，而是用AI压缩证明、提炼定义、重构最小核心；把不同领域的形式化成果互译成共用构件。同步制定作者权属与数据许可的行业准则，以及算力与碳足迹的报告规范，确保这座大厦既高且稳。

新知 - 大圆镜｜AI攻克13道数学难题，却暴露了致命缺陷

对抗知识焦虑，从看懂这条开始

App 下载

自我博弈：AI的“猜想-证明”闭环

你可以把AI的自我博弈机制，想象成一个自己和下象棋的棋手——它左手提出一个新的数学猜想，右手立刻尝试证明这个猜想，每一次成功或失败的反馈，都会让下一次的猜想更精准，证明更高效。

这套机制的核心，是解决了传统AI数学证明的“稀疏奖励”难题：过去AI只能在人类已有的证明数据里学习，正确的样本少得可怜，就像在沙漠里找水。而自我博弈让AI自己“造水”——它会生成那些“刚好能被证明”的猜想，每一次尝试都能得到明确的反馈，训练效率直接翻倍。

以斯坦福的STP系统为例，它在Lean形式化平台上，通过2400万次证明尝试和360万次猜想生成，把证明成功率从13.2%拉到了28.5%。DeepMind的Aletheia更是把这套逻辑用到了极致：先让Gemini模型狂灌算力生成200个候选证明，再用自然语言验证器筛掉逻辑不通的部分，最后靠形式化工具Lean把剩下的63个证明，打磨成13个能被数学界认可的成果。

形式化验证：严谨性的最后一道闸门

如果说自我博弈是AI的“创造力引擎”，形式化验证就是它的“严谨性闸门”——这是一种用计算机能读懂的逻辑语言，把数学证明拆成一步一步的符号推理，每一步都要符合严格的逻辑规则，连一个逗号的错误都藏不住。

Lean就是目前最常用的“闸门工具”之一，它的数学库里已经装下了从基础代数到高阶拓扑的数百万条定理。AI生成的证明只有翻译成Lean语言，通过它的自动验证，才能被数学界承认是“正确”的。

但这套闸门也有漏洞。Aletheia曾给埃尔德什留下的一道错题，生成了长达几十页的“完美证明”——AI只在乎每一步推理符不符合逻辑，却根本不会判断“这道题本身有没有意义”。就像一个只会严格执行指令的工匠，哪怕你让他用黄金打造一块没用的砖头，他也会给你做出一块毫无瑕疵的金砖头。

更棘手的是“潜意识剽窃”：AI的训练数据里装着人类几百年的数学文献，它生成证明时，会无意识地把冷门论文里的思路重新包装，连它自己都不知道这是“借鉴”还是“抄袭”。形式化验证能查逻辑对错，却查不出这些思路的来源。

范式转移：数学家从“解题者”变“审美者”

当AI能批量生成严谨的证明，数学家的角色正在发生本质的变化——他们不再是趴在草稿纸上推导的“解题者”，而是变成了AI成果的“审美法官”和“逻辑审计员”。

陶哲轩曾说，AI擅长“清扫低垂的果实”——那些因为太繁琐、太耗时间，人类数学家懒得碰的难题，AI靠算力就能轻松解决。但数学界真正看重的，从来都不只是“正确”，更是证明里的“美感”：是不是够简洁？有没有带来新的思路？能不能启发更多的研究？

比如GPT-5.4解决埃尔德什1196问题时，用了人类数学家从未想到的von Mangoldt函数思路，这份证明被称为“来自上帝之书”的优雅解法——这种“意料之外，情理之中”的创造力，才是人类数学家不可替代的价值。而AI生成的大部分证明，都只是逻辑正确的“学术垃圾”，冗长、繁琐，毫无启发性。

现在，数学家的工作变成了从AI生成的海量证明里，挑出那些真正有价值的思路，判断哪些猜想值得深入研究，甚至还要帮AI“擦屁股”——找出它无意识剽窃的旧论文，纠正它给错题做的证明。

AI闯入数学界的这一年，与其说它攻克了百年难题，不如说它撕开了数学研究的旧面纱：原来那些被视为“天才专属”的工作，很大一部分只是算力堆出来的繁琐劳动；原来“严谨”和“正确”，也可能是没有意义的逻辑游戏。

逻辑可以代工，但审美无法复制。未来的数学研究，会是一场人机协作的双人舞：AI负责踩稳每一个逻辑的节拍，人类负责跳出那些充满美感的舞步。而这场舞蹈的终点，从来都不是证明多少道题，而是不断拓展人类对“美”和“真”的边界。

逻辑负责正确，审美决定价值。

自我博弈：AI的“猜想-证明”闭环

形式化验证：严谨性的最后一道闸门

范式转移：数学家从“解题者”变“审美者”

评论