AI设计的蛋白质，比进化更“聪明”吗？

要说“更聪明”，得看你考哪门。若是面向清晰目标、在庞大序列空间里快准狠地找增益，AI已多次压过自然选择。生成模型能跳出进化既有路径：如ESM3造出的新型荧光蛋白，改了近百处仍高效发光；迭代式“设计–实验–再设计”把周期从2–5年压缩到2–6个月、样本量从上万降到百级。一些团队还报告，AI优化的抗体亲和力可提升十数到数十倍，某些酶的准确性甚至出现百倍级改进。可若把“聪明”理解为在真实生物体内同时兼顾稳定性、免疫原性、分子互作与环境适应，进化依然更老练。AI强在定向打分，弱在生物语境；它依赖训练数据与体外指标，难穷尽蛋白的动态行为与细胞内状态，分布外风险与模型偏差常让体外“王者”落地失色。至今完全由AI设计并获批上市的蛋白药仍未出现。更准确的结论是：AI在“定制优化”上更聪明，在“整体适应”上仍需向进化取经，两者合奏才是更强的演化引擎。

当AI成生物学家，我们还做什么？

AI能当“生物学家”，人类更像总设计师与守门人。首先，我们要定义“为什么做”和“做到什么算成功”：选靶与适应症边界、可制造性与免疫原性红线、剂量与毒理安全窗、预算与节奏，以及多目标权衡的评分函数。在MatwingsVenus这类闭环里，AI负责在巨大搜索空间内迭代，我们来定目标函数、设置实验预算与停更准则，并在意外结果里发现新机制。其次，人要打造“量尺”和“赛道”：发明能区分好坏的高通量表型与正交测定，设计选择压力与对照，建立数据溯源、误差条与不确定性评估，补齐关键“负结果”。失效解析、因果推断与反事实实验仍离不开人类直觉与跨学科拼图。把分子变成产品也需要我们：工艺放大、稳定性和CMC、GMP与质控、临床试验与终点设定、支付方价值论证，以及生物安全红队与模型护栏。AI更快，我们更准与更稳。

AI当“造物主”，你最想造什么？

我会先“造”一套碳回收三件套：常温海水也高效咬合PET的超级酶、把甲烷稳态变甲醇的MMO变体、以及把烟道气CO2还原为可发酵中间体的合成酶。天然版本卡在活性与稳定性，正适合用AI闭环把效率、耐溶剂和半衰期一起抬高，让塑料、甲烷、CO2变回原料。其次是“口服生物药穿梭蛋白”：在小肠双受体协同转运，护送胰岛素或GLP‑1跨黏膜，同时耐胃酸、抗蛋白酶、低免疫原。以往用转铁蛋白/毒素片段效率低且风险高；借助对话式干湿闭环，可把亲和力与稳定性调到可临床区间，让人逐步告别针剂。还想要一枚“输血助手”——超专一ABO去糖基化酶，把A/B型红细胞快转O且零表位残留。肠道菌酶已证明可行，但副反应掣肘。AI可重塑底物通道、屏蔽支链亲和，目标是血库内小时级处理、批间可控。在最紧急的时刻，它也许能决定生死。

新知 - 大圆镜｜AI把蛋白质研发周期从年缩到了周

对抗知识焦虑，从看懂这条开始

App 下载

从盲试到精准：AI破解蛋白设计的天文难题

蛋白质是生物世界的「功能芯片」，但它的设计难度远超人类制造的任何芯片——一个由100个氨基酸组成的蛋白，理论上有10^130种序列组合，比宇宙中的原子总数还多。传统的蛋白研发只能在自然进化的「存量」里微调，或是靠随机突变碰运气，就像在大海里捞一根针。

而AI的出现，把这根「针」的位置直接指给了科学家。以上海交大团队的平台为例，他们先攒下了近100亿条蛋白序列的「超级数据库」，每条序列都带着温度、pH值等65亿个环境标签——相当于给每根「针」都标上了它能在什么环境里干活。再用这些数据训练出AI大模型，它能像读懂语言一样读懂蛋白序列，直接根据产业需求设计出符合要求的蛋白：比如要更耐热的甜味蛋白，或是能穿透细胞膜的药物载体。

你可以把这个过程类比成「定制菜谱」：数据库是全球所有食材的档案，AI是能根据你的口味和食材特性直接出菜谱的厨师，而不是让你自己在菜市场里瞎逛。

干湿闭环：让AI和实验室对话

光靠AI设计还不够——毕竟电脑里的蛋白再完美，也得在现实的试管里验证。以前这是两道完全割裂的工序：AI团队出设计，实验团队做验证，中间要靠人工对接，数据反馈慢则几周，快则几天，一轮迭代下来就是半个月。

现在的「对话式干湿闭环」，把这两道工序拧成了一个高速转动的轮子：AI在云端生成设计方案，直接通过接口传给自动化实验平台，机器人24小时不间断地完成基因合成、蛋白表达、功能测试，实验数据实时传回AI模型，模型立刻根据结果调整参数，生成下一轮更精准的设计。整个过程像两个人在实时对话：AI说「我设计了这个」，实验室答「它在pH3下活性不够」，AI马上回「那我调整这几个氨基酸试试」。

有团队用这套系统优化无细胞蛋白合成，6轮迭代就做了3.6万次实验，把生产成本降了40%，产量提了27%。更关键的是，科学家从以前的「实验操作员」，变成了「需求定义者」——不用再蹲在实验室加样，只需要告诉AI「我要什么」，剩下的交给闭环自己跑。

当然，这套系统也不是万能的：目前它还只能处理相对成熟的蛋白功能需求，对于需要复杂动态构象的蛋白，AI的预测精度还不够；而且自动化实验室的成本不低，中小团队很难复制。

从实验室到工厂：生物制造的范式革命

过去，生物制造的逻辑是「先研发，后生产」：在实验室里磨出一个能用的蛋白，再花几年时间优化生产工艺，放大到工厂规模。而AI闭环正在把这个逻辑反过来——「设计即生产」。

因为AI在设计蛋白的时候，就已经把生产条件考虑进去了：比如会不会在发酵罐里容易降解，能不能用低成本的培养基大量表达。甚至有些平台已经能直接对接工厂的生产数据，让AI设计出的蛋白天生就适合工业化生产。这就像你定制家具的时候，直接让设计师按照你家电梯的尺寸来画图纸，不用等做好了再改。

这种范式的转变，正在重构整个生物制造产业：以前创新药的靶点发现要花5-10年，现在用AI闭环可能1-2年就能完成；以前农业里的固氮酶只能靠自然筛选，现在AI能设计出更高效的人工固氮酶，减少化肥使用。但这也带来了新的挑战：比如AI设计的「非天然蛋白」，如何制定统一的安全标准？海量的蛋白数据，如何保证隐私和产权？

当AI能像设计代码一样设计蛋白，当实验室能像工厂流水线一样自动验证，生物制造就不再是少数专家的「黑魔法」，而是能像软件编程一样快速迭代的创新工具。这背后的本质，是人类终于打破了自然进化的「速度限制」——以前自然要花几百万年才能筛选出的功能蛋白，现在我们用AI只要几天。

「设计即生产，验证即迭代。」这不仅是蛋白研发的新规则，更是生命科学走向产业应用的新起点。未来，我们或许能定制出分解塑料的酶，能设计出只杀癌细胞的蛋白，甚至能创造出自然界从未有过的生物功能——而这一切的起点，就是AI和实验室的那一句「对话」。

从盲试到精准：AI破解蛋白设计的天文难题

干湿闭环：让AI和实验室对话

从实验室到工厂：生物制造的范式革命

评论