设计新分子是化学领域最具挑战性的工作之一。无论目标是一种救命药物还是一种前沿材料,每种化合物都必须通过一系列精心规划的反应步骤来合成。绘制这些步骤需要深厚的专业知识和战略思维,这也是为什么化学家往往需要数年时间才能熟练掌握这一过程。
其中一大难关是逆合成分析。在这种方法中,化学家从最终目标分子出发,反向推导出更简单的原料和可能的反应路线。这涉及大量决策,例如选择合适的构建模块、确定何时形成环结构,以及判断分子中的敏感部位是否需要保护。虽然计算机可以扫描庞大的"化学空间",但在战略判断方面,它们仍难以媲美经验丰富的化学家。
另一个挑战在于反应机理,即通过电子的逐步移动来描述反应如何进行。理解这些机理可以帮助科学家预测新反应、提高效率、避免高昂的试错成本。尽管现有的计算工具能够提出多种可能的反应路径,但它们往往缺乏准确找出最合理路径所需的直觉判断能力。
AI赋能化学推理的全新方法
由瑞士联邦理工学院洛桑分校(EPFL)的Philippe Schwaller领导的研究团队,开发了一种将大语言模型作为化学推理工具的新方法。这些模型不直接生成化学结构,而是作为评估者来引导现有的计算系统。
这一名为Synthegy的新框架,将传统搜索算法与能够理解自然语言化学策略的AI相结合。
发表在《Matter》期刊上的Synthegy论文第一作者Andres M Bran表示:"在为化学家开发工具时,用户界面至关重要,而以往的工具依赖繁琐的过滤器和规则。Synthegy赋予化学家直接用语言表达想法的能力,让他们能够更快速地迭代,并探索更复杂的合成思路。"
Synthegy如何改进逆合成规划
Synthegy从一个目标分子和一条用日常语言写成的简单指令出发。例如,化学家可以要求某个特定的环结构提前形成,或避免使用不必要的保护基团。标准的逆合成软件随后会生成多条可能的路径。
每条路径都会被转化为文本,由大语言模型进行审查。Synthegy会对每个选项与化学家指令的匹配程度进行评分,并给出推理说明,从而更容易对最佳路线进行排序和筛选。通过自然语言引导搜索,化学家可以快速聚焦于符合自身目标的策略。
用AI理解反应机理
Synthegy将类似的方法应用于反应机理分析。它将反应分解为基本的电子运动步骤,并探索不同的可能性。大语言模型对每个步骤进行评估,并将搜索引导至化学上合理的路径。
该系统还可以整合额外的信息,例如以文本形式提供的反应条件或专家假设,让研究人员能够精细化分析并探索更符合实际的场景。
性能表现与化学家验证
在合成规划方面,Synthegy能够识别出符合复杂策略指令的反应路径。在一项双盲研究中,36名化学家提供了368份有效评估,平均有71.2%的评估结果与系统的输出结果一致。
该框架能够标记不必要的保护步骤、评判反应的可行性,并优先推荐高效方案。研究还表明,大语言模型可以在多个层面发挥作用,从分析官能团到评估完整的合成路线均有涉及。规模较大的模型表现最佳,而规模较小的模型则能力相对有限。
AI在化学领域的全新角色
这项研究揭示了AI支持化学研究的另一种方式。Synthegy并非要取代人类决策,而是将大语言模型定位为辅助解读和优化计算结果的引导者。化学家可以用日常语言描述目标,并获得能够反映其策略意图的解决方案。
这一方法有望加速药物研发、改善反应设计,并让更多科学家能够便捷地使用先进工具。
Andres M Bran表示:"合成规划与反应机理之间的关联令人振奋:我们通常借助机理来发现新反应,进而合成新分子。我们的工作正通过统一的自然语言接口,在计算层面弥合这一鸿沟。"
Q&A
Q1:Synthegy是什么,它在化学研究中能做什么?
A:Synthegy是由EPFL研究团队开发的AI化学辅助框架,结合了传统搜索算法与大语言模型。它允许化学家用自然语言描述合成策略,系统会自动评估多条反应路径并打分排序,帮助化学家快速找到最符合目标的逆合成路线,同时也可用于分析反应机理,大幅降低试错成本。
Q2:Synthegy的准确率如何,有经过验证吗?
A:有。研究团队进行了双盲验证实验,共有36名化学家参与,提供了368份有效评估。结果显示,化学家的判断与Synthegy系统输出结果的一致率平均达到71.2%,证明该系统在合成规划任务上具有较高的可靠性。
Q3:Synthegy对药物研发有什么实际帮助?
A:Synthegy可以让研究人员用日常语言表达合成目标,系统自动筛选出最优反应路径,减少繁琐的人工筛选过程。这有望显著加速药物分子的设计与优化流程,降低研发周期和成本,同时让更多不具备深厚计算化学背景的科学家也能使用高级合成规划工具。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。