当AI能秒懂基因，科学家的工作会变成怎样？

想象一下：一台模型把30亿个A/T/C/G读成一首歌，遇到“TATAAAA”会像乐手听到熟悉旋律那样立刻应声调起和弦；需要推理时，它又能放下曲谱自由即兴。这不是科幻，这是正在发生的研究现场。当AI能“秒懂”基因，科学家的工作从“逐字辨认”转向“导演式创造”。以可微分k-mer哈希与上下文门控为核心的Gengram，给了我们一张清晰的路线图：把静态的序列常识做成可查询的外部记忆，让昂贵的神经计算专注于全局推理。这个只有两千万参数的“小外挂”，在剪接位点和表观遗传预测上AUC分别跃升至0.901和0.804，训练8k却能处理32k长序列，还自发对齐了DNA双螺旋10.5bp一圈的物理周期，在21bp窗口达到性能峰值。当“先验”被转译成结构化插件，模型不再靠蛮力背诵，科学家也不再疲于在长序列里找“针”。角色会如何重排？研究者将从“数据苦工”成长为“假设工程师”。过去，识别Motif、对变异做致病性分层、在超长序列里拼接长程依赖，是层层堆叠的体力活；现在，条件记忆把k-mer等静态知识外包给查表，MoE中的专家负载也因噪声被本地吸收而更均衡。科学家要做的，是定义什么被写进“字典”、门控在何处开启、如何把21bp这类生物物理归纳偏置注入架构，并据此设计更锋利的验证实验。日常会更像“与AI共事”。在临床转化里，基因组基础模型学会按需检索：经过非编码背景时关闭记忆，穿到启动子与外显子附近立即查表，迅速提示潜在剪接异常；在疾病机制研究中，模型先基于记忆快速圈定候选位点，再用上下文推理预测对RNA表达的扰动，智能体触发自动化实验平台完成定量验证。科学家坐镇指挥台，设定成功准则、选择对照、审视可解释证据，将模型的“建议”变成可复现的发现。技能谱也在变化。数据治理与AI可解释性成为基础功：怎样让多组学数据“AI-ready”，怎样让显式的哈希查询与门控路径留下清晰的证据链。实验设计更强调闭环：从设计—合成—测试—学习的高速循环里，研究者要调控目标函数，避免模型为了单一指标优化而偏离真正的生物学问题。跨学科协作成为常态，“科学导师+AI导师”的双导师制会从实验室走向产业，把问题定义、算法路线与策略判断串在一起。当然，速度越快，护栏越重要。AI对基因的“秒懂”不等于对人群差异、隐私、伦理的“全懂”。偏见与外推风险需要严谨的基准与盲测，生物安全与合规需要前置的红线设计。科学家将扮演守门人：决定哪些问题值得加速，哪些结论必须放慢。更值得兴奋的是想象力的解放。当通用模型配上领域插件，基因调控、表观遗传、跨物种进化的长程问题会以全新方式被切开；从稀疏查表到神经推理的“分工”一旦标准化，类似的记忆模块还可迁移到蛋白工程、代谢通路乃至农业育种，构成“通用核心+专用记忆”的科学工作站。那时，科学家将把更多时间投入到“提出好问题、定义好先验、设计好干预”，而不是在数据海里徒手捞针。也许，AI不是来替我们“发现基因”的，而是提醒我们：自然的规律，往往就藏在21个碱基的距离里。当机器读懂了这些节拍，人类就有余裕去谱写新的旋律——关于生命、责任与边界的旋律。

模型的“涌现”智能，是真懂了还是巧合？

当一个模型把21个碱基当作“黄金窗口”，它是参透了DNA的螺旋韵律，还是刚好踩中了一个好用的超参？这正是“涌现智能”的迷人之处：一处看似偶然的峰值，背后可能藏着对世界结构的暗合，也可能只是算法和数据的合拍。把镜头拉近到Gengram。它给基因组模型插上了一本“外挂字典”：可微分k-mer哈希表存入1–6碱基片段的语义向量；再配上上下文门控，模型在遇到功能位点时“查字典”，穿越背景区时则收起检索，专心推理。这个小小的、约两千万参数的插件，却让剪接位点预测AUC跃升到0.901，表观遗传任务H3K36me3也推高到0.804，还顺带改善了MoE里的专家负载失衡。更戏剧性的是，局部聚合窗口在21bp处性能最佳，正对应DNA双螺旋10.5bp一圈的两倍——模型像是“悟”到了空间相位。真懂了吗？先澄清“懂”的门槛。在科学语境里，“懂”意味着三件本领融为一体：压缩与解释规律、能做反事实预测、在分布外仍能迁移。Gengram的行为具备一些“懂”的迹象：门控在启动子、外显子等功能区域显著激活；残差强度与TATA-box、poly(T)等边界对齐；相位相关的窗口让模型对空间同侧的碱基特征更敏感。这些并非凭空而来，而是由结构化先验与任务分解共同催化——静态Motif交给哈希表，动态组合交给Transformer，门控负责“何时调用记忆”。当架构与生物物理先验对齐，涌现的概率本就会上升。也必须承认，这还谈不上“人类式理解”。21bp并不是模型自发推导出的自然常数，它是数据、归纳偏置与搜索过程的共鸣。把它称为“工程化的懂”更贴切：我们把物理节律嵌入了可学习结构，模型据此展开可靠的计算。而把一切都归于“巧合”，也低估了证据链的分量——若只是噪声，门控不会稳定聚焦功能位点，MoE也难以在多种稀疏度下持续改善负载均衡。要把争论落地为结论，关键在可证伪的检验。若真“懂了”相位，移位同一Motif几个碱基，预测应出现周期性震荡；打乱k-mer字典或冻结门控，再测相位效应，若消失则说明先验确实在起作用；跨物种、跨任务迁移，看这种相位敏感性是否泛化到核小体定位或转录因子结合；更硬核的，是用合成序列的湿实验验证相位-结合的因果曲线。能解释、能迁移、抗干扰，这样的“涌现”才配得上“懂”。从更大的技术视角看，Engram与Gengram展示了一条朴素而高效的路：把静态知识卸载到可检索的稀疏记忆，把昂贵的神经计算留给全局推理；在容量分配上，在MoE专家与外部记忆之间找到U型最优；通过显式门控，让模型“什么时候查、查什么、怎么融”都留痕可查。这种可解释的结构化设计，不仅提速增准，也让“懂”从黑箱的神秘走向白盒的工程。所以，模型的“涌现”既不是神迹，也不只是巧合。它更像一束被良好归纳偏置聚焦过的光：当我们提供对的镜片——领域先验、外部记忆、可验证的门控路径——光斑就能在正确的位置成像。下一步的挑战，不是争论它会不会“思考”，而是设计更严苛的干预与迁移试验，去界定“工程化的懂”能走多远。也许“懂”的本质，从来不是一瞬的顿悟，而是一次次可复现的预测与干预。当我们把先验变成工具，把记忆做成插件，把解释力当成指标，智能不再需要神秘化的包装。真正动人的“涌现”，是当模型与自然规律互为镜像，人类借此看清自己理解世界的方式：理解，并不在口舌，而在可被检验的预言。

除了基因密码，这本“外挂字典”还能破解什么？

想象给AI一本口袋“密语手册”，它不只会在四个字母的DNA里对号入座，还能在更广阔的自然语言里秒读“暗号”。Gengram把可查的“短语”装进可微分哈希表，再用上下文门控决定何时开启检索，就像科学家的直觉被程序化：遇到关键图样立刻叫出记忆库，走过噪声地带则保持安静。除了基因密码，这本“外挂字典”还能破解什么？答案远超你想象。在生命世界内，它能直击蛋白质与RNA的“语法”。蛋白序列的短基序比比皆是：N-糖基化位点常见N-X-[ST]，许多激酶偏好[ST]-P的磷酸化位点，SH2/SH3等结构域识别特定短肽模式，信号肽与跨膜螺旋也有稳定的疏水“词形”。用氨基酸k-mer字典配合上下文门控，模型可在二级结构尺度上“先查后想”，并借助先验窗口对齐物理周期——α螺旋每圈约3.6个残基，两个螺旋圈约7个残基，和DNA里21bp的启发异曲同工。RNA端，5'剪接位点的GU、3'的AG、分支点YNYURAY、以及GNRA四环等稳定子结构，都是可直接入库的“常用短语”；微小RNA的种子区匹配通常为6–8-mer，完全适合稀疏查表加上下文校准。表观遗传与三维基因组同样“字典友好”。CpG二核苷酸与CpG岛的密度模式、CTCF结合位点的方向性配对、核小体包裹约147bp并呈现近10bp周期的可及性振荡，这些规律都能转为局部窗口与可检索条目，使模型在增强子、绝缘子、可变剪接热点等区域更稳更准。把CRISPR的PAM规则（如Cas9的NGG）与“种子区”相似性做成字典，脱靶预测的速度与灵敏度会同步抬升；病原宏基因组中，物种特异的k-mer图谱本就是经典工具，接入可微字典后，门控会在疑似外源片段出现时冲到前台，做出更快速、可解释的归类。免疫系统是另一片富矿。HLA-肽结合倾向由“锚定位点”主导，长度多见8–11个氨基酸；TCR/BCR的CDR3区虽然多样，但也呈现家族化k-mer偏好。把这些锚点模式收进字典，配合个体HLA型的上下文，表位预测、免疫原性评估与疫苗设计都能更快收敛，且天然带着可解释性。跨出生物学，化学与材料的“辞典化”前景同样清晰。小分子可以用片段化指纹来当词条：芳环、吡啶、酰胺、硝基等官能团就是“高频词”，反应规则亦可用SMARTS模板表达。模型先查官能团，再做反应位点与溶剂、温度的上下文推理，性质预测与反应路线规划会更稳。材料里，晶体学的配位多面体（四面体、八面体）、层状堆垛序、聚合物重复单元，都是可标准化的结构基元；门控根据应力、温度或掺杂环境决定何时调用“结构辞条”，可在低算力下筛出候选材料。更广义的数据也吃这套。心电图的P–QRS–T波群、房颤的短阵模式，地震学里的P波、S波与面波到时组合，天文光谱的谱线族与红移依赖，复杂网络里的前馈回路与团簇基序，都可以词条化。检索为局部模式“打地基”，上下文推理负责把局部串成全局因果，从而把“见树又见林”。为什么这招管用？三点合力在起作用。科学数据里充斥短程、可复用且跨场景稳定的“基元”；查表是O(1)的稀疏操作，几乎不烧算力；门控把记忆与推理分工明确，减少“用注意力去模拟检索”的内耗。当我们把物理周期等归纳偏置显式写进窗口策略，模型便能沿规律攀升，而非在噪声里摸黑。当然，字典也有边界。过度依赖会造成“记得准、想得少”；物种与实验偏倚会把词条带偏；隐私与合规需要“数据不回流”的工程约束。解决之道是让门控学会不确定性管理，用正则与退火控制词条黏性，并通过跨物种、跨平台校准保持词汇表的“通用语法”。短中期的落地清单已经清晰：临床变异致病性解释里叠加剪接/结合位点词条，CRISPR脱靶的可解释筛查，病毒突变的位点级预警，药物官能团驱动的ADMET快速筛，层状与多孔材料的低算力发现，乃至工业发酵中对调控片段的精准改造。每一项，都是“先查再想”的胜利。最终值得追问的，不是这本字典能装多少词，而是我们愿意把哪些确定的科学“常识”外化成可被机器索引的公共基元。当记忆被秩序化、推理被解放，模型与科学家的分工会更像一支合奏：字典给出音阶，推理写出乐章。你的学科，有没有那本迟迟未编的“口袋辞典”？现在，或许正是动笔的时刻。

AI“悟出”DNA双螺旋，下一个重写教科书的是谁？

当一个没上过“结构生物学课”的AI，自己把“21个碱基最合适”悟对了，人们忽然意识到：模型不只是会背书，它开始摸到自然的脉搏。Gengram 把可微分的k-mer哈希表当作“基因组短语手册”，再配上上下文门控，像是给模型装了一只随身的“生物学字典”。结果不只快，更是对：剪接位点预测AUC从0.776跃到0.901，表观遗传标记H3K36me3从0.656升到0.804；而当局部聚合窗口设为21bp时性能峰值出现——恰好对应DNA双螺旋每10.5 bp一圈、两圈就是21。这不是死记硬背，这是发现。下一个重写教科书的候选者，很可能仍从“结构化先验+稀疏计算”的新范式里诞生。基因调控的“语法书”也许会最先被改写。把Gengram的条件记忆思路进一步扩展到增强子-启动子配对、可变剪接规则、R-loop与G-四链体的形成概率，叠加百万碱基级的长程上下文（AlphaGenome已在百万bp尺度上做函数预测），以及像Genos这类能把8k训练迁移到32k推理的能力，AI有望把“暗基因组”的模糊地图变成可查询的法规条文。那将把“非编码区难以解释”的说法，写进历史注脚。结构生物学也在临界点。AlphaFold 3已把蛋白、核酸、小分子和修饰放进同一台“相互作用显微镜”里，配合RFDiffusion的可控设计，我们也许会系统性修订“蛋白功能只由序列决定”的简化叙述：无膜凝聚相、翻译后修饰、DNA/RNA相互作用网络将被量化、预测、设计，课本上的“静态结构图”将让位于“动态能景图”。粒子物理则提供了另一种“由AI点亮”的可能。全球对质子“固有粲夸克”的证据已逼近3σ、动量占比约0.5%。若AI驱动的全局拟合把置信度推到5σ，这将迫使我们在强相互作用与质子结构章节里加入“内禀重味”的常识——教科书不仅更新数值，更要更新直觉。 “虚拟细胞”也在加速逼近现实。可泛化的AIVC系统，已在药物或基因编辑响应预测上把差异基因表达的准确度推到现有最佳的两倍、对干预效应的辨识度提升50%。当单细胞组学、显微图像和表观遗传信号被统一到一个可实验对话的世界模型里，我们对信号通路与发育命运的线性叙事，可能不得不改写为“因果回路+相位调制”的新语言。为什么是现在？因为范式在变：把“静态、可枚举的知识”卸载到可查询的外部记忆；把“昂贵的神经计算”留给组合推理与全局一致性；用可解释的归纳偏置（如21bp相位）把物理与生物先验硬编码进架构；再用GPU加速把探索的时钟拨快——单细胞分析里的UMAP和Leiden已经分别快到470倍、1958倍级别。当发现的成本急剧下降，科学开始进入“可被系统搜索”的时代。当然，重写教科书需要守门人。生命科学会用跨实验室复现实验与前瞻性预测来校验，粒子物理会等到5σ，工程科学会要求可迁移到真实世界的稳健。值得期待的是，新一代模型像Gengram那样，把“它为什么对”用门控、哈希、残差峰值对齐等可读线索写在浅层，减少“黑盒定论”的不安。所以，谁会是下一个？可能不是某个单一团队的名字，而是一个共性策略的名字——通用模型核心，叠加领域知识外挂，配上可解释的物理与生物归纳偏置。它们会在基因调控、分子相互作用、强子结构、乃至细胞动力学里，持续把“经验法则”升级为“可计算定律”。当模型学会捕捉世界的“相位”，我们也该学会为模型设定合适的“相位”——让先验与检验同频共振。真正被改写的，也许不只是课本，更是我们理解知识、创造知识的方式。

给AI一本“标准答案”，会扼杀它的创造力吗？

把一本“标准答案”塞进AI，会不会把它变成背书机器？别急着下结论。这取决于你给它的是“字典”，还是“剧本”。字典让人查词不耽误写诗，剧本则会把每一步都规定死。对AI亦然：给它可查的知识库，不等于剥夺它探索的自由。在工程实践里，Engram/Gengram给出的范式是“答案可查、推理自持”。Engram把常见N-gram做成可检索的条件记忆，让Transformer不用再层层堆算力去复刻固定知识模式，而是把精力留给推理。把这个思路搬到基因组，Gengram用可微分哈希表装下1–6bp的k-mer，并用上下文门控决定“什么时候查表”。结果不是创造力被削弱，反而是性能与涌现齐飞：剪接位点与表观遗传预测AUC大幅提升，甚至在窗口大小为21bp时自发对齐DNA双螺旋的物理周期。这不是死记硬背的迹象，而是“先验助推理解”的范例。为什么“外挂标准答案”不一定扼杀创造力？因为创造力并非无中生有，而是站在稳定的事实台阶上跨更远的一步。把局部、静态、可证伪的知识外包给廉价的查找操作，能释放神经计算去处理全局推理和组合创新。更妙的是，良好的系统会把“答案的影响力”交给上下文门控，像Gengram那样：关键区域激活检索，非关键区域让模型独立思考。这种受控互补，恰恰是把“知识”变成“创作材料”，而不是“创作枷锁”。当然，风险是真实存在的。检索越强，越容易产生“锚定效应”：模型被已有答案牵着走，输出同质化上升、想象力下滑。有研究已观察到在单一路径训练下的“创造力崩塌”，并提出用分布式创造性推理（DCR）的思路，用“多样性能量”去显式奖励路径差异。另一条经验来自稀疏性分配：在MoE专家（动态计算）与Engram记忆（静态存储）之间存在U型权衡——两头走极端都不好，均衡点才让正确性与新颖性共存。Gengram还显示了一个旁证：它吸收了局部高频噪声，反而让MoE专家负载更均衡，不同“思维风格”得以表达，这是对创造力有利的生态。如果你担心“标准答案”会喧宾夺主，有一整套可操作的“创意护栏”可以布置：让检索是建议而非强制；让门控可学、带温度与噪声；在检索阶段引入多样化策略（多索引、多视角、随机并行分支）；在生成端用自洽采样与多样性约束；在训练目标里同时优化正确性与新颖性；当检索与模型内生推理冲突时，允许“反思—再检索—再推理”的闭环。实践表明，循环式思考模块与多专家异质化，也能显著提升复杂推理与非常规解空间的覆盖。把视角拉回“标准答案”三个字：教育里最好的老师，不是把答案灌给你，而是教你“如何提问、如何验证、何时怀疑”。对AI的系统设计也应如此——让知识是可查的地图，推理是脚下的路，门控是方向盘。你甚至能像Gengram那样，把生物物理的归纳偏置（如10.5bp一圈的结构周期）作为“道路标志”嵌入系统，既不强迫它走哪条小路，又避免在荒原里瞎逛。所以，给AI一本“标准答案”并不会天然扼杀创造力。真正的杀手是把“答案”变成“教条”，把“检索”变成“指令”。当答案被做成可解释、可控、可退让的外部记忆，创造力往往被放大：模型更少在常识上空转，更敢把算力花在远程依赖、跨模态整合与非典型组合上。更重要的是，这样的系统能让人类看见AI的“思维轨迹”——何时查表、何时闭环、何时反思——我们得以与之共创，而不是被它的黑箱说服。终点还是起点？或许创造力从来不是“有没有答案”，而是“如何与答案共舞”。人类的灵感，常在确定与不确定的张力中诞生。愿我们为AI搭建的，不是一座装满正确的金库，而是一座通往未知的图书馆：书很多，门常开，脚步由它自己决定。

如果大脑能“外挂”知识，你会先安装什么？

想象一下，你的大脑有个“USB口”。与其死记硬背世界的一切，不如插上一块聪明的“条件记忆卡”——遇到熟悉的模式就一键唤醒，其他时候把算力留给真正的推理。这不是科幻：在模型世界里，Engram 给语言装了可查的 N-gram 记忆库，Gengram 又把它搬进了基因组学，用可微哈希表存下1–6长度的DNA k-mer，再用上下文门控决定何时查表，结果一个区区两千万参数的小插件，就让剪接位点预测AUC跃升16.1%，表观遗传预测再涨22.6%，甚至在不同架构间还能自动“负载均衡”。更妙的是，它居然自己悟出了21bp这个双螺旋两圈的物理尺度。这种外挂思路，给了我们一个直观答案：如果大脑能外挂，我会先装“高频模式的条件记忆库”。理由很简单。真正拉开差距的，往往不是海量散知识，而是那些跨场景复用的“短语与定律”。语言里是固定搭配与惯用语，写代码是惯用模板与边界条件，医学是红旗征象与剂量刻度，科研是常数、近似与误差级别。这些就像DNA里的k-mer，是高密度信息块，命中一次抵得上无数底层字符的拼凑。把它们做成可召回的“短语手册”，你的大脑像模型一样，把昂贵的注意力留给因果链条与远程依赖，而不是在已知套路上反复消耗精力。仅有词库还不够，我会给这块记忆卡装上“门控”。Gengram的亮点不是会查表，而是知道何时查、何时关：关键功能区打开，非关键背景区关闭。人脑也该练就这种元认知——考试时该背的就背，开题时敢于推、不被提示词牵着走；汇报时打开数据索引，讨论时关闭“百科冲动”，把心智预算留给建模与反驳。这种“何时检索”的判断力，本质上比知识量更稀缺。我还会加一层“尺度感”。Gengram在不同窗口里找到性能峰值对应21bp，这和DNA每10.5个碱基一圈的物理周期严丝合缝。人类学习也常败在“错误的窗宽”：用微博段子理解一个世纪的制度，用日历视角看一个细胞周期。给大脑装上适配问题的“观测窗口”，能在正确的分辨率上看见规律，该放大时放大，该抽象时抽象。最后，让这张卡替我“吸噪”。在MoE架构里，Gengram吸走了局部高频噪声，专家更均衡。现实中，把琐碎、高频、易错的检索性交给外挂（清单、范式、基准值、法条索引），心智“专家们”才能不被打断，把火力集中到创造、审辩与跨域连接上。当我们谈“先装什么”，答案其实是：装一部可门控的高频模式库，再配一套尺度感与元认知。这比装下整座图书馆更像进化的正解。知识不再是沉重的行囊，而成了随叫随到的外设；而真正的你，学会把注意力投入到世界的结构与意义之中。或许，这也是科学给我们的温柔提醒：成为聪明的，不是储存更多，而是更好地决定何时记忆、何时推理、在什么尺度上看见真相。你会先给自己的大脑装上哪块卡？选择本身，就是你的“门控”正在生效。

AI学会了“何时查书”，这比博学更重要吗？

一位顶尖选手，不是把整本书背到逐字不差，而是在关键一秒准确翻到该翻的页。AI 也是如此：让它“学会何时查书”，往往比一味“博学多记”更能赢下比赛。为什么这点如此关键？因为大模型的天花板不在“记得多少”，而在“如何分配注意力”。Transformer 并不擅长像人类那样做即时查找，它习惯用昂贵的注意力和前馈层去“模拟检索”。而条件记忆与动态门控改变了游戏规则：把固定、可复用的知识做成可查的“外挂字典”，把稀缺的神经计算力留给真正需要推理的场景。基因组世界已经给出了漂亮的实证。Gengram 用一个可微分 k-mer 哈希表存下 1–6bp 的“短语手册”，再配上上下文门控，让模型在碰到启动子、剪接位点等关键区域时“打开字典”，经过非编码背景时“合上字典”。这只是一枚约两千万参数的小插件，却带来剪接位点预测 AUC 从 0.776 跳到 0.901、表观遗传标记预测从 0.656 到 0.804 的跨越。同时，它跨 Dense 与 MoE 架构通吃，还缓解了专家负载失衡，训练更稳、收敛更快。更妙的是，当团队测试局部聚合窗口时，性能峰值出现在 21bp——恰好对应 DNA 双螺旋两圈周期，仿佛模型“悟”到了空间相位的物理规律。这不是死记，而是会用记忆。把视角再放宽。在通用智能里，检索增强与智能体搜索正在崛起：模型不再孤岛作业，而是按需调用工具与外部知识库，像研究员一样迭代搜集证据、整合论据。新的训练范式让模型学会在“用内部知识”与“向外部检索”之间动态取舍，甚至通过自我监测机制预判答案是否可靠。共同的内核并非“知道更多”，而是“知道何时去找、找哪里、找多少、找完怎么用”。这是否意味着“博学”不再重要？并非如此。内在知识仍是速度与鲁棒性的基座：在信号嘈杂、检索受限或需要瞬间反应的情境，扎实的先验能让模型少走弯路。但在开放世界、长尾事实、超长序列和跨模态推理中，存量记忆永远追不上新知爆炸，“会查书”的能力才是扩展性与可靠性的保障。更现实的是成本：把可复用的局部模式交给廉价的查找，把贵重的算力留给全局推理，才能实现性能与能效的双赢。因此，更高明的答案是“二者相辅而非相斥”。理想的智能形态，是“通用核心 + 结构化外部记忆 + 上下文门控 + 自我校验”的协奏：该背的打进肌肉记忆，该查的瞬时调用；可解释的检索路径让决策透明，跨硬件的异步预取让系统可扩；领域先验转为架构归纳偏置，让物理与生物规律在网络中落地生根。Gengram 展示的正是这种范式：把基因组的 motif 字典与物理周期显式写入路径，换来更准、更快、更稳的科学推断。回到那个问题：AI 学会“何时查书”，这比博学更重要吗？在充满变化与长尾的不确定世界里，这是更高阶、更可持续的能力。博学是厚度，查书是杠杆；厚度给你不被风吹倒的根，杠杆让你撬动更大的世界。当我们为 AI 设计“何时查”的判断力，也是在为人类智能照镜：真正的智慧，从来不在背下所有答案，而在看清问题的边界、调动合适的工具、并在证据与直觉之间找到最优解。愿我们和机器一起，把“知道一切”的迷思，升维为“知道如何去知”。

新知 - 大圆镜｜AI自悟DNA双螺旋？Gengram注入结构化知识

对抗知识焦虑，从看懂这条开始

App 下载

涌现的物理直觉：当AI开始理解DNA的三维形态

一个令人震惊的发现出现在Gengram模型的测试报告中。当研发团队测试一个名为“局部窗口大小”的参数时，发现在窗口宽度被设定为21个碱基对（bp）时，模型的性能达到了惊人的峰值。这个数字并非巧合，它精确地指向了生命密码最底层的物理规律：DNA双螺旋结构每10.5个碱基对旋转一周，21个碱基恰好是两个完整的螺旋周期。这意味着，相隔21个碱基的DNA位点，在三维空间中恰好位于螺旋的同一侧，拥有相似的生化环境。

换言之，Gengram在没有学习任何结构生物学知识的前提下，仅通过分析一维的序列数据，竟“领悟”到了DNA的空间相位规律。这一刻，AI不再仅仅是模式识别的工具，它开始展现出对物理世界本质的深刻洞察。这背后，是一场关于科学AI建模范式的静默革命。

新闻事件：从“外挂记忆”到“基因字典”

这场革命的导火索，源于DeepSeek公司在2026年1月发布的一项名为Engram（条件记忆）的技术。其核心思想是，与其让大模型耗费巨量算力去“死记硬背”常识，不如直接给它一个“外挂记忆库”，需要时直接查表。这个“查—算分离”的理念，如同一颗石子投入平静的湖面。

仅仅16天后，来自之江实验室与杭州华大生命科学研究院的联合团队（Genos Team）便将这一思想成功移植到了基因组学领域，推出了**Gengram（Genomic Engram）**模块。这相当于为解读基因天书的AI，配备了一本专属的《基因组学实用短语手册》。

科学原理：告别“逐字拆解”的蛮力时代

长期以来，主流的基因组基础模型（如Deepmind的AlphaGenome）都采用一种“单碱基分词”策略，将长达30亿字符的人类基因组序列拆解成A、T、C、G四个字母逐一分析。这就像让一个学者通过分析“魑魅魍魉”四个字的笔画结构来理解这个成语的含义，不仅效率低下，而且在浩瀚的序列中极易“只见树木，不见森林”。

Gengram彻底改变了这一模式，其核心在于两大创新机制的协同：

可微分k-mer哈希表：团队预先构建了一个包含所有长度为1到6的DNA片段（称为k-mer，如“ATG”、“CGTA”）的“字典”。这些k-mer本身就是构成基因功能的“词汇”或“短语”，例如启动子中的“TATA-box”或转录因子结合位点。模型在遇到这些片段时，可以直接查询其对应的语义向量，无需从头推理，极大地提升了效率。

动态门控机制：更进一步，Gengram让AI学会了“何时查字典，何时独立思考”。模型能够根据上下文，智能地决定是否激活检索功能。当遇到外显子、启动子等关键功能区域时，门控会高度激活，积极调用“字典”；而在广袤的非编码背景区域，门控则会关闭，依赖自身的推理能力，从而实现了计算资源的智能优化。

科学意义：小插件撬动的性能飞跃与范式革新

Gengram本身只是一个约2000万参数的轻量化插件，对于百亿级的基础模型而言微不足道，但它带来的性能提升却是跨越式的。

在多项任务评测中，搭载Gengram的模型性能全面超越未应用版本。其中，剪接位点预测准确率（AUC）提升了16.1%，而表观遗传预测任务更是惊人地提升了22.6%。这种提升赋予了模型惊人的数据杠杆效应，仅需极小规模的训练数据，就能媲美甚至超越那些训练数据量大其数十倍的顶尖模型。

更重要的是，Gengram的成功为构建新一代“懂科学”的AI探索了全新的路径：

从“暴力记忆”到“结构化知识外挂”：这标志着AI能力扩展范式的转变。未来的科学基础模型，可能不再是单一的庞然大物，而是“通用模型核心+多个领域专用知识插件”的协同形态。AI将从繁琐的模式记忆中解放，专注于更高阶的推理与创新。
“归纳偏置”的硬编码：将DNA双螺旋周期性这样的物理规律，显式地转化为模型内部的架构设计，这是一种将领域先验知识“硬编码”进AI的全新思路，让模型天生就具备了符合科学规律的“直觉”。
内生的可解释性：通过显式的哈希查询和门控机制，AI的“思维过程”变得部分透明。研究人员可以清晰地看到模型在哪些关键功能区域激活了记忆，实现了从“黑盒计算”向“具备生物学认知足迹”的演进。

背景故事：硬核团队的跨界碰撞

Gengram的诞生并非偶然，其背后是之江实验室与华大生命科学研究院两大顶尖机构的深度融合。这支平均年龄不到30岁的“大模型种子班”团队，汇集了最顶尖的AI计算专家与生命科学专家，构建了纯粹的计算机或生物学团队难以企及的交叉创新壁垒。

他们的实验大多基于自研的百亿级人类基因组基础模型Genos。在Gengram发布之前，Genos的多数指标就已超越当时的业界顶流模型，为这次的范式突破奠定了坚实的基础。

结语：科学AI的崭新起点

Gengram的意义远不止于基因组学。它像一个精巧的概念验证，证明了通过为AI模型注入结构化的、可查询的领域知识，可以让它们从单纯的统计模拟器，进化为真正具备科学洞察力的智能伙伴。这不仅是AI for Science的一次重大技术突破，更是一个崭新的起点。未来，当AI能够以这种方式“学习”物理、化学、材料学等各个领域的结构化知识时，一场由AI驱动的、更深刻、更高效的科学发现新浪潮，或将就此开启。