化学家只需用文字描述,AI就能自动设计分子

瑞士洛桑联邦理工学院研究团队开发了名为Synthegy的新框架,将大型语言模型引入化学合成规划领域。化学家只需用日常语言描述合成策略,系统即可自动评估逆合成路径并打分排序。在36名化学家参与的双盲测试中,系统结果与人工评估的吻合率达71.2%。该框架同样适用于反应机理分析,有望加速药物研发并降低化学工具的使用门槛。

设计新分子是化学领域最具挑战性的工作之一。无论目标是一种救命药物还是一种前沿材料,每种化合物都必须通过一系列精心规划的反应步骤来合成。绘制这些步骤需要深厚的专业知识和战略思维,这也是为什么化学家往往需要数年时间才能熟练掌握这一过程。

其中一大难关是逆合成分析。在这种方法中,化学家从最终目标分子出发,反向推导出更简单的原料和可能的反应路线。这涉及大量决策,例如选择合适的构建模块、确定何时形成环结构,以及判断分子中的敏感部位是否需要保护。虽然计算机可以扫描庞大的"化学空间",但在战略判断方面,它们仍难以媲美经验丰富的化学家。

另一个挑战在于反应机理,即通过电子的逐步移动来描述反应如何进行。理解这些机理可以帮助科学家预测新反应、提高效率、避免高昂的试错成本。尽管现有的计算工具能够提出多种可能的反应路径,但它们往往缺乏准确找出最合理路径所需的直觉判断能力。

AI赋能化学推理的全新方法

由瑞士联邦理工学院洛桑分校(EPFL)的Philippe Schwaller领导的研究团队,开发了一种将大语言模型作为化学推理工具的新方法。这些模型不直接生成化学结构,而是作为评估者来引导现有的计算系统。

这一名为Synthegy的新框架,将传统搜索算法与能够理解自然语言化学策略的AI相结合。

发表在《Matter》期刊上的Synthegy论文第一作者Andres M Bran表示:"在为化学家开发工具时,用户界面至关重要,而以往的工具依赖繁琐的过滤器和规则。Synthegy赋予化学家直接用语言表达想法的能力,让他们能够更快速地迭代,并探索更复杂的合成思路。"

Synthegy如何改进逆合成规划

Synthegy从一个目标分子和一条用日常语言写成的简单指令出发。例如,化学家可以要求某个特定的环结构提前形成,或避免使用不必要的保护基团。标准的逆合成软件随后会生成多条可能的路径。

每条路径都会被转化为文本,由大语言模型进行审查。Synthegy会对每个选项与化学家指令的匹配程度进行评分,并给出推理说明,从而更容易对最佳路线进行排序和筛选。通过自然语言引导搜索,化学家可以快速聚焦于符合自身目标的策略。

用AI理解反应机理

Synthegy将类似的方法应用于反应机理分析。它将反应分解为基本的电子运动步骤,并探索不同的可能性。大语言模型对每个步骤进行评估,并将搜索引导至化学上合理的路径。

该系统还可以整合额外的信息,例如以文本形式提供的反应条件或专家假设,让研究人员能够精细化分析并探索更符合实际的场景。

性能表现与化学家验证

在合成规划方面,Synthegy能够识别出符合复杂策略指令的反应路径。在一项双盲研究中,36名化学家提供了368份有效评估,平均有71.2%的评估结果与系统的输出结果一致。

该框架能够标记不必要的保护步骤、评判反应的可行性,并优先推荐高效方案。研究还表明,大语言模型可以在多个层面发挥作用,从分析官能团到评估完整的合成路线均有涉及。规模较大的模型表现最佳,而规模较小的模型则能力相对有限。

AI在化学领域的全新角色

这项研究揭示了AI支持化学研究的另一种方式。Synthegy并非要取代人类决策,而是将大语言模型定位为辅助解读和优化计算结果的引导者。化学家可以用日常语言描述目标,并获得能够反映其策略意图的解决方案。

这一方法有望加速药物研发、改善反应设计,并让更多科学家能够便捷地使用先进工具。

Andres M Bran表示:"合成规划与反应机理之间的关联令人振奋:我们通常借助机理来发现新反应,进而合成新分子。我们的工作正通过统一的自然语言接口,在计算层面弥合这一鸿沟。"

Q&A

Q1:Synthegy是什么,它在化学研究中能做什么?

A:Synthegy是由EPFL研究团队开发的AI化学辅助框架,结合了传统搜索算法与大语言模型。它允许化学家用自然语言描述合成策略,系统会自动评估多条反应路径并打分排序,帮助化学家快速找到最符合目标的逆合成路线,同时也可用于分析反应机理,大幅降低试错成本。

Q2:Synthegy的准确率如何,有经过验证吗?

A:有。研究团队进行了双盲验证实验,共有36名化学家参与,提供了368份有效评估。结果显示,化学家的判断与Synthegy系统输出结果的一致率平均达到71.2%,证明该系统在合成规划任务上具有较高的可靠性。

Q3:Synthegy对药物研发有什么实际帮助?

A:Synthegy可以让研究人员用日常语言表达合成目标,系统自动筛选出最优反应路径,减少繁琐的人工筛选过程。这有望显著加速药物分子的设计与优化流程,降低研发周期和成本,同时让更多不具备深厚计算化学背景的科学家也能使用高级合成规划工具。

来源:ScienceDaily

0赞

好文章,需要你的鼓励

2026

05/11

15:20

分享

点赞

邮件订阅