海森大数据

抗生素曾是人类最锋利的武器之一，对付细菌无往不利。然而，广谱抗生素在杀死致病菌的同时，也会波及有益的微生物群，对克罗恩病等肠道炎症患者尤其不友好，同时给耐药菌留下更大的进化空间。如今，人工智能正在重塑这一局面——从10,747个分子到460亿个候选，AI把抗生素研发从“大海捞针”变成了一门可计算的实验科学。

从筛选到机制：AI的第一次证明

2023年，麦克马斯特大学的Jonathan Stokes团队从10,747个生物活性小分子中筛选出窄谱抗生素enterololin，目标直指与肠道感染相关的黏附侵袭性大肠杆菌（AIEC）。然而，找到一个候选分子只是开始——理解它如何工作，往往是更漫长、更昂贵的瓶颈。

团队转向了MIT Regina Barzilay团队开发的DiffDock。这是一个扩散生成模型，将分子对接视为概率问题，通过迭代精化预测小分子与蛋白质的结合方式。模型在大约100秒内给出答案：enterololin靶向细菌生存必需的LolCDE脂蛋白转运复合体。后续的突变株实验迅速验证了这一预测。

Barzilay指出：“AI在药物发现中很多应用是在搜索化学空间、识别新分子。我们这里展示的是，AI还能提供机制解释，这对推动分子通过研发管线至关重要。”

虚拟筛选：从数百万分子中“捞”出候选

在enterololin之前，Stokes团队已经用另一条路径验证了AI的潜力。他们用约2,300种分子的数据训练了Chemprop模型——一个基于神经网络的架构，将原子序数、键类型等分子特征与抗菌活性关联起来。模型筛选了数百万分子，最终锁定了被命名为halicin的激酶抑制剂。

但拥有训练数据只是第一步——如何标记和分类同样重要。帝国理工学院的Bartlett团队在整理文献时，使用RDKit和xTB等计算工具模拟分子在水或细胞脂膜中的表现。她指出，训练数据中至少10%的分子需要能穿透细菌包膜，模型才能学习预测细菌积累的特性。而她参与的一些数据库包含超过10万个分子，通常只有3%能进入她感兴趣的细菌类型。Bartlett还提到，如今Gemini和ChatGPT等AI工具可以帮助排查代码故障，“你仍然得知道该问什么，但不必是代码架构本身的专家。”

肽的复兴与生成式设计

另一条路径来自宾夕法尼亚大学César de la Fuente团队的APEX（antibiotic peptide de-extinction）。这个深度学习模型筛查了超过1,000万条肽序列，找出37,000多条被预测具有广谱抗菌活性的候选。团队合成并测试了69条肽，发现不少分子作用于细菌的细胞质膜——这类新机制理论上更不容易被既有耐药谱直接拦住。后续的ApexGO生成式模型更进一步：从模板出发生成新肽，在约100条已合成测试的肽中，约86%对至少一种病原体显示抗菌活性。

可合成性：从虚拟到现实的天堑

真正棘手的地方，往往出现在分子被AI设计出来之后。James Collins团队的一个例子很有代表性：他们先用生成模型在淋病奈瑟菌和金黄色葡萄球菌相关空间里扩展出数百万种化合物，再借助可合成性模型和毒性、活性过滤，最后把清单压到不到5,000个，其中只有90个看起来真有希望，最终能实际合成的只有22个，真正有抗菌活性的仅6个。

Stokes团队在此基础上推出了SyntheMol-RL。这个强化学习模型在约460亿个化合物空间中寻找“既有效、又能合成”的答案。它基于约15万个分子“积木”和50种化学反应，像搭乐高一样配置这些片段，生成新的化合物。团队合成了79个独特于训练集的候选分子，其中13个在体外表现出较强活性。其中一个命中物synthecin甚至在MRSA小鼠伤口感染模型中显示疗效。

Stokes强调：“实验室里找到一种有抗菌活性的新化合物不重要，如果它不能在体内溶解、对人体细胞有毒、或者无法代谢排出的话。漂白剂有抗菌活性，火也是——但它们显然不符合其他条件。好的药物候选必须满足多个不同标准。”

从可能性到实用

到目前为止，这些AI赋能的抗生素项目都还停留在临床前阶段，没有哪一个已经真正变成能帮助患者的新药。但它们的意义在于把一条漫长的研发链条拆成了更短的几段：先筛候选，再猜机制，再筛可合成性，最后进入湿实验和动物模型。

未来，最有效的不是模型展现的性能有多花哨——如果无法把电脑里的事变成现实，实验就失去了意义。AI正在把抗生素研发改写成一门可计算的实验科学，但真正的考验，永远在实验室和临床之间。