当AI学会写论文，谁来当它的导师？

当AI会写论文时，真正的“导师”不再是某一人，而是一套叠加的监督体系：资深学者做认知导师，负责提出可证伪的问题、设定交叉检验与停机条件；独立TEVV团队做方法导师，对模型、数据与代码实施第三方测试验证；机构的伦理与数据治理部门做规范导师，强制披露与合规。要把导师职能落到地面，就给AI立“实验室笔记本”：按可复现标准保存提示词、版本/种子、数据谱系与决策理由，并执行A/B模型对照与独立复算。多家期刊与高校已要求随稿提交AI使用说明、保留生成记录，甚至限制直出文本占比并标示，这把“过程”纳入评审，让人类导师能对异常系数与可疑图表逐项复核。谁来培养这套能力？图书馆与研究诚信办公室正在开设提示素养与AI取证课程，催生“研究诚信分析师”等新角色。答案因此很明确：AI写得再快，也要由人类专家+第三方验证+制度化可审计流程共同充当它的导师，否则产出只是看起来像科学的稿件。

科研的“笨功夫”，真的无可替代吗？

“笨功夫”里无可替代的不是体力，而是由反复推导、调错、对照原理所长出的心智结构：直觉、误差嗅觉和可迁移的模型。认知科学早就证明“有益的困难”能显著提高长期保持与迁移；真正的专业化还依赖大量情境化失败所积累的“默会知识”。当下最强的模型也仍需有经验的人类设定检验点与反证路径，否则就会把貌似合理的答案一路放行——这恰恰是“笨功夫”练出的免疫系统。可替代的是不增智的摩擦：排版、样板代码、格式转换、已知算法的机械复现。聪明的做法不是丢掉“笨功夫”，而是把它改造成可控的训练：先手算一遍再让工具加速，先写验算清单再让模型补全，要求全过程记录与可复现实验，公开标注AI介入环节，并把负结果与误差分析计入评价。这样，工具承担体力，研究者保留思考；效率上去，理解不掉线。

AI包办底层科研，是捷径还是陷阱？

两头分野。对成熟研究者，它是捷径：在已知框架内自动化检索、编码和措辞，几乎线性提速。多项追踪显示，标注使用LLM的作者预印本产出提升约30%—50%，非英语母语者获益更大。但这只在“有人把关”时成立——你得知道答案大致应长什么样、该做哪些交叉校验。对初学者，它多半是陷阱。AI的似是而非会训练出一种自动化自信，却掏空建模直觉与误差感知；人因研究早已表明，长期依赖自动化会削弱手工能力。监督本身就是科学，跳过“笨功夫”，等于把唯一不可替代的学习环节外包。想走捷径不掉坑：把AI限定在“最后一公里”——当你已能写出伪代码、预期残差与边界条件，再让模型加速实现；把提示词纳入实验记录，保证可追溯；设置无AI复现实验与口头推导闯关；在论文中披露AI使用并附全流程检查清单。让人当建筑师，机器当工具。

新知 - 大圆镜｜博士生AI代做科研：“认知外包”正在掏空学术训练

大圆镜

内容由AI生成，思考得你完成

App Store 下载 Android 下载

认知外包：从“工具辅助”到“思考替代”

“认知外包”并非简单的工具使用——它指的是人类将核心认知活动，比如推理、判断、逻辑构建等，直接交由AI完成，自身从“思考者”退变为“结果消费者”。这和我们用计算器算题、用笔记整理资料的“认知支持”完全不同：后者是工具帮我们减轻记忆或计算负担，思考的主体依然是人类；而前者则是把“该怎么想”“该怎么做”的决策权彻底交给机器。

认知心理学的研究已经证实了这种模式的隐患：一项针对698名中国大学生的实验显示，过度依赖AI的学生，批判性思维能力会显著下降；另一项编程学习实验中，用AI辅助完成任务的参与者，独立调试代码的能力比纯手动组低17%。更隐蔽的是“能力错觉”——AI生成的流畅结果会让使用者误以为自己已经掌握了知识，直到脱离工具才发现，自己连最基础的逻辑链条都无法梳理。就像那些长期依赖自动驾驶的飞行员，一旦需要手动操作，连基本的起降动作都可能出错。

评价体系：“数量至上”制造的激励陷阱

认知外包在科研圈的流行，本质是学术评价体系的制度性结果。现行体系几乎完全围绕可量化指标运转：论文数量、期刊影响因子、引用次数，这些数字直接决定了博士生能否拿到奖学金、青年学者能否申请到基金、科研机构能否获得拨款。而AI代理恰好能精准命中这套体系的“命门”——它可以在短时间内产出大量符合格式规范、语言流畅的“合格论文”，却无需投入科研训练最核心的“试错成本”。

这种“数量优先”的激励机制，让年轻科研人员的选择变得完全理性：与其花一年时间在错误中打磨思考能力，不如用AI在三个月内产出三篇论文，快速积累简历资本。但这套体系的致命缺陷在于，它无法衡量“不可计量”的东西——比如一个博士生在调试代码时突然理解的统计逻辑，在反复读论文时建立的学科直觉，在追着导师问“为什么”时养成的批判思维。这些恰恰是科研创新最核心的底层能力，也是AI永远无法替代的部分。

破局尝试：用“建设性摩擦”守住认知底线

面对认知外包的冲击，部分高校和研究者开始尝试用“建设性摩擦”重新设计科研训练体系。这一理念的核心是，在AI工具的使用中制造适度的认知挑战，避免使用者直接跳过思考过程。比如，要求学生必须先手动完成一次数据分析，才能用AI辅助优化；或者让AI只提供“错误提示”而非“正确答案”，迫使学生自己排查逻辑漏洞。

一些高校已经开始调整评价标准，比如将科研过程中的反思报告、实验日志、问题讨论纳入考核，而非只看最终论文。但这些尝试仍面临现实阻力：在“发表即生存”的学术生态里，愿意花时间培养学生能力的导师可能面临基金考核压力，愿意放弃短期产出的学生可能错失职业机会。如何在效率与能力之间找到平衡，依然是悬在学术圈头顶的难题。

当我们讨论AI对科研的影响时，最容易陷入“技术乐观”或“技术恐慌”的二元对立：要么认为AI会彻底解放科研人员，要么担心AI会取代人类科学家。但这场关于Alice和Bob的讨论，指向了一个更本质的问题：科学研究的终极目标到底是“产出论文”，还是“培养会思考的人”？

对于天文学这样的基础学科来说，精确的哈勃常数数值或许并非核心，真正重要的是一代代科研人员在探索宇宙中养成的思考方式——那种愿意花两周时间追一个符号错误、对着混乱的代码发呆一下午的“笨功夫”，才是科学进步最坚实的根基。**认知外包可以产出论文，却产不出科学家。**当我们用AI跳过那些“无意义的摩擦”时，其实也跳过了学术成长最关键的部分。

认知外包：从“工具辅助”到“思考替代”

评价体系：“数量至上”制造的激励陷阱

破局尝试：用“建设性摩擦”守住认知底线

评论