如何识破AI炮制的“幽灵论文”？

先戳“外壳”。对参考文献逐条验身：DOI能否解析，且作者、题名、期刊、年份逐项吻合；不吻合多为“嵌合”，解析失败多为伪造。再用Crossref/PubMed/Google Scholar/OpenAlex交叉搜“标题+第一作者”；零命中或元数据偏差大，基本判死。看作者ORCID与机构邮箱是否真实连续，卷期页码与年份是否合理。正文若充斥套话、前后自相矛盾、引文与方法脱节，也在拉红线。再掐“内肌”。图表若现条带/细胞图复用、单位混乱、p值扎堆0.04–0.05、置信区间不含点估计，或伦理批准/临床注册号、数据集与代码仓库一查即空，几乎铁证。关系网若是跨洲拼盘且无既往合著史、通讯作者短期轮换刷量、反复推荐私人邮箱审稿人，或编辑委员查无此人，基本坐实。实操用图像取证工具、批量DOI/元数据比对器、撤稿与评论平台交叉验证，并要求原始数据。

学术造假，AI是帮凶还是主谋？

如果非要判定角色，AI更像高效的帮凶而非主谋。它把不良激励放大：能生成“看似靠谱”的引文、批量改写与润色，让抄袭与拼装更隐蔽，也让审稿人因文本流畅而放松警惕；论文工厂据此提效扩产，传统查重更难奏效。多项学界调查还显示，LLM使用已相当普遍，但披露比例显著偏低，监管空档进一步降低了作假的风险成本。真正的主谋仍是人和制度——“唯论文/唯影响因子”的晋升逻辑、按APC计费而把关松弛的流程、以及对引用当作“装饰”的文化。补救之道不是“禁用AI”，而是把责任与可验证性前移：作者对支撑性结论逐条完成引文核验并留痕，投稿端强制DOI/PMID与可达性校验不过即退，编辑与机构用图像取证与统计取证识别模板化造假，而不以不可靠的“AI写作检测”定罪。一旦披露、可追溯与惩戒形成闭环，AI就会从帮凶被驯化为合规的生产力。

当引用成空，科学大厦会崩塌吗？

不会塌，但会变形。引用是论文之间的“配电网”，空引用像偷接电：短期灯还亮，长期电压不稳。最先烧坏的是系统综述、临床指南和依赖排名算法的文献检索；虚假节点会抬高权重，二级证据随之偏航，且误差会在综述—指南—实践的链路上级联放大。可重复性、注册登记、数据与代码共享让“地基”仍稳，但上层承重墙正被悄悄掏空。解决不是靠呼吁自律，而是工程化隔离风险：把参考文献从“能看”变成“能验”，提交即强制 DOI/PMID 等可机核标识与可访问链接；编辑生产线自动校验、人工抽检原文，逐项对账元数据与 PDF；系统综述只纳入可获取全文且方法可复核的研究；将捏造引用按学术不端处理并设立随机事后审计；同时把科研评价从“数量”转向“可重复性、共享合规与纠错记录”。做到这些，科学大厦不会崩塌，但必须及时给被 AI 蛀空的梁柱加固。

新知 - 大圆镜｜AI写论文省时间，却造出4000条假引用

对抗知识焦虑，从看懂这条开始

App 下载

AI为什么爱编假引用？

你可以把生成式AI想象成一个记性差但口才好的写手：它能精准模仿学术论文的措辞和引用格式，却没法像人类一样「查资料」——它的所有输出都是基于训练数据的概率预测，而非事实核查。比如ChatGPT-3.5生成的引用里，有55%是完全虚构的，哪怕升级到GPT-4，仍有18%的虚假率；而在医学领域，Google Bard生成的引用虚假率甚至高达91.4%。这些假引用往往伪装得极具迷惑性：用真实的作者名字搭配虚构的论文标题，或是把不同论文的期刊、年份、卷号拼凑在一起，看起来格式标准、出处权威，连资深学者都可能被蒙混过关。更麻烦的是，AI生成的假引用会进入学术数据库，被后续论文引用，形成「假权威」的连锁反应——就像一颗扔进湖里的石子，涟漪会不断扩散，污染整个知识体系。

不止是技术问题，更是学术生态病

虚假引用的泛滥，不全是AI的锅。托帕兹团队分析了280万篇论文、9700万条引用后发现，超过三分之一的假引用来自两家大型开放获取出版商——这类期刊靠收取作者版面费盈利，审核资源有限，难以对每一条引用进行核实。但更深层的原因藏在学术评价体系里。「发表或灭亡」的压力让不少研究者把引用当成了「凑数任务」：过去引用是对前人研究的深度对话，现在却成了用AI一键生成、填满参考文献栏的表面功夫。西北大学的研究诚信专家穆罕默德·侯赛尼说得直接：「这说明有人连半小时核对引用的时间都不想花，他们只想着快点发表——而这正是学术评价体系过度量化的恶果。」更讽刺的是，假引用还可能形成恶性循环：AI从污染的学术数据库里学习，再生成更多假引用，最终导致「模型崩溃」——AI自己也分不清哪些是真研究，哪些是它编出来的。

学界在补窟窿，但漏洞还在

面对假引用的冲击，不同期刊的应对方式拉开了差距。《Science》《新英格兰医学杂志》等顶级期刊已经用上了自动化引用核查工具：比如Scite.ai能自动交叉验证引用，显示文献是否被支持、质疑或撤回；Trinka Citation Checker则能直接识别「幻觉引用」。这些工具确实有效，《Science》的发言人表示，他们至今还没遇到过发表论文里出现假引用的情况。

但开放获取期刊和很多普通期刊还在裸奔。PLOS出版社承认，他们在投稿中发现了大量无法核实的引用，虽然正在测试核查工具，但面临着高误报率的问题——合法引用常因为格式错误、数据库收录不全被误判为假引用。除了技术手段，学界也在补制度的课：美国心理学会等机构要求作者必须披露AI使用情况，部分期刊把AI辅助写作的规范写进了投稿指南；不少高校开始开设AI伦理课程，教学生怎么辨别AI生成的假内容。但这些措施还只是「补丁」——要真正解决问题，可能得先改变「以发表数量论英雄」的评价逻辑。

当我们讨论AI带来的学术诚信危机时，其实在问一个更本质的问题：我们到底需要什么样的学术？是快速生产、填满数据库的论文，还是真正推动知识进步的研究？托帕兹的那次社死经历，更像一个预警——AI只是放大了学术生态里早已存在的浮躁，假引用不过是浮在水面的冰山一角。「效率诚可贵，诚信价更高」，这句老套的话，在AI时代突然有了新的重量。毕竟，学术的根基从来不是论文的数量，而是每一条引用背后，对真相的较真。