对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
结合模式|分子生成效率|蛋白质口袋|SeFMol|同济大学|新药研发|医学健康
想象一下:你要给一个随时在变形的口袋配一把刚好贴合的钥匙——过去的药物设计就是这么干的。科学家拿着蛋白质的静态“口袋”结构,在固定的化学库里找“钥匙”,但真实的蛋白质从来不会老老实实待着,它的口袋会动、会变,导致90%以上的候选药物在后续实验中折戟。直到同济大学的团队拿出了SeFMol:一个能跟着口袋变形调整的“动态钥匙生成器”,把分子生成效率提了20倍,还找到了过去从未发现的全新结合模式。这到底是怎么做到的?
过去的药物设计像在刻舟求剑——科学家先通过冷冻电镜或AlphaFold拿到蛋白质的静态结构,再用这个固定的“口袋”去筛选分子。但真实的生物世界里,蛋白质是动态的:它的结合口袋会随着温度、环境甚至结合的分子变化形状,就像一个会呼吸的弹性囊。静态模型生成的分子,往往只能卡在某个瞬间的口袋里,一旦口袋变形,就失去了结合能力。

SeFMol的核心突破,就是把“刚性分子”变成了“半柔性分子”。你可以把它想象成一个会微调的钥匙:当口袋的形状变了,钥匙的齿纹也能跟着轻微调整,始终贴合口袋的内壁。具体来说,团队把分子的生成过程拆成了一个马尔可夫决策过程——每一步生成都像一次试探,强化学习会根据当前口袋的形状、分子的结合效果,动态调整下一步的生成策略。

直给补刀:
传统的扩散模型生成分子需要1000步,就像用砂纸慢慢打磨出一把钥匙,不仅慢,还容易磨过头。SeFMol团队设计了一种快速采样策略,把步数压缩到了50步,相当于直接从毛坯跳到接近成品的形状,再用精细打磨收尾——效率提升了20倍,却没损失分子的质量。

这种提速的关键在于“预训练+微调”的两步走:先在无靶标的分子库上做刚性预训练,让模型先学会生成符合药物基本性质的分子;再针对特定靶点做半柔性的强化学习微调,让模型学会跟着口袋变形。就像先批量生产符合标准的钥匙坯,再根据每个用户的口袋做个性化微调,既保证了效率,又保证了精准度。
实验数据最有说服力:在CrossDocked2020测试集上,SeFMol生成的分子平均Vina评分达到-7.23 kcal/mol(数值越低,结合力越强),成功率11.53%,比当前最好的方法还要好。更重要的是,面对从未见过的真实蛋白质,它生成的分子不仅能保留经典的结合模式,还找到了过去从未发现的全新结合化学型——相当于给旧口袋找到了新的钥匙齿纹。
当然,SeFMol也不是完美的。它的第一个局限是对数据的依赖:虽然用了自监督训练,但如果某个靶点的蛋白质结构数据太少,模型的表现还是会打折扣。就像如果只有一张口袋的模糊照片,再厉害的钥匙匠也难做出精准的钥匙。
第二个局限是合成可行性的预测:模型虽然能生成符合药物性质的分子,但有些分子的合成路线过于复杂,甚至根本无法合成。目前的模型只能基于现有数据预测合成难度,还无法完全替代有机化学家的经验判断。
第三个局限是监管的挑战:AI生成的药物分子需要经过严格的临床试验,而监管机构对AI药物的审批标准还在完善中。比如FDA要求AI模型的决策过程必须可解释,但SeFMol的强化学习过程就像一个“黑箱”,很难完全拆解每一步决策的依据。
从静态到动态,从固定化学库到动态生成,SeFMol的出现,其实是药物设计思路的一次转向——不再是让分子去适应静态的蛋白质,而是让分子跟着蛋白质一起“动”起来。未来,随着AlphaFold 3等技术能预测更复杂的蛋白质动态结构,结合强化学习的半柔性分子生成模型,或许能把药物研发的周期从数年缩短到数月,甚至为罕见病、难治性疾病找到全新的治疗靶点。
金句:药物设计的未来,是跟着生命一起“呼吸”。