在所有可能存在的化合物中,据估计有10??到10??种化合物具有作为小分子药物的潜力。
然而,对每一种化合物逐一进行实验评估,对于化学家来说耗时过长,根本无法实现。因此,近年来,研究人员开始借助人工智能来辅助筛选潜在的候选药物化合物。
麻省理工学院(MIT)副教授康纳·科利(Connor Coley,博士,2019届)便是其中一位。他是1957届职业发展副教授,同时在化学工程系、电气工程与计算机科学系以及MIT施瓦茨曼计算学院担任联合职位。他的研究横跨化学工程与计算机科学两个领域,致力于开发和应用计算模型,分析海量潜在化合物、设计新型分子,并预测生成这些化合物的反应路径。
"这是一种极为通用的方法,可以应用于有机分子的各类场景,但我们主要关注的还是小分子药物的发现。"他说道。
AI与科学的交汇
科利对科学的热情似乎来自家庭的熏陶。他提到,自己家中的科学家比非科学家还多——父亲是一位放射科医生,母亲拥有分子生物物理与生物化学学位,后来进入MIT斯隆管理学院深造,祖母则是一位数学教授。
在俄亥俄州都柏林读高中期间,科利积极参加科学奥林匹克竞赛,并在16岁时便提前毕业。随后他进入加州理工学院,选择化学工程专业,因为这个专业恰好能将他对科学与数学的兴趣融为一体。
本科期间,他同样热衷于计算机科学,曾在一个结构生物学实验室使用Fortran编程语言,参与蛋白质晶体结构的解析工作。从加州理工毕业后,他决定继续深耕化学工程,于2014年来到MIT攻读博士学位。
在导师克拉夫斯·延森(Klavs Jensen)和威廉·格林(William Green)教授的指导下,科利致力于优化自动化化学反应。他的研究聚焦于将机器学习与化学信息学——即将计算方法应用于化学数据分析的学科——相结合,以规划合成新型药物分子的反应路径。与此同时,他还参与设计了能够自动执行这些反应的硬件装置。
其中部分工作是在美国国防高级研究计划局(DARPA)资助的"Make-It"项目框架下开展的,该项目专注于利用机器学习和数据科学,提升从简单构建模块合成药物及其他有用化合物的能力。
"那段经历真正让我开始思考化学信息学、机器学习,以及如何利用模型来理解不同化学物质的合成方式和可能发生的反应。"科利说。
还在读博士期间,科利便开始申请教职,并在25岁时接受了MIT的职位邀请。关于是否留在自己攻读博士的学校任职,他收到了各种不同的建议,但最终认为MIT的这个机会实在难以割舍。
"MIT在资源配置和跨部门协作的流畅度上都极为独特。MIT在支持AI与科学的交叉融合方面做得非常出色,这里是一个充满活力的生态系统,值得留下来。"他说,"学生的水准、他们的热情,以及这里无与伦比的合作氛围,都远远超过了留在同一所学校可能带来的任何顾虑。"
化学直觉
科利推迟了一年入职,前往博德研究所(Broad Institute)进行博士后研究,积累了更多化学生物学和药物发现方面的经验。在那里,他致力于从DNA编码文库的数十亿候选分子中筛选出可能与疾病相关突变蛋白产生结合作用的小分子化合物。
2020年回到MIT后,他组建了自己的实验室团队,目标不仅是利用AI合成现有的具有治疗潜力的化合物,更是要设计具备理想性质的新型分子,并探索合成它们的新途径。过去几年间,他的实验室开发了多种计算方法来推进上述目标。
"我们会思考如何将化学领域的挑战与合适的计算解决方案相匹配,而这种匹配往往又会推动新方法的诞生。"科利说。
他的实验室开发了一款名为ShEPhERD的模型,该模型通过分析候选药物分子的三维空间形状,评估其与靶蛋白的相互作用方式,从而筛选潜在的新型药物分子。目前,这一模型已被多家制药公司用于辅助新药发现。
"我们希望赋予生成模型更多药物化学的直觉,让模型能够感知正确的评判标准和考量因素。"科利说。
在另一个项目中,科利实验室开发了一款名为FlowER的生成式AI模型,可用于预测不同化学原料组合后的反应产物。
在设计该模型时,研究人员将质量守恒定律等基本物理原理内嵌其中,同时要求模型对从反应物到产物的反应路径中各中间步骤的可行性进行评估。研究发现,这些约束条件显著提升了模型预测的准确性。
"思考中间步骤、反应机理以及反应的演变过程,对化学家来说是非常自然的事情——化学本就是这样教的,但这并不是模型会自发思考的内容。"科利说,"我们花了大量时间研究如何让机器学习模型真正扎根于对反应机理的理解,就像一位资深化学家那样去思考问题。"
他实验室的学生还在化学反应优化的诸多相关领域开展研究,包括计算机辅助结构解析、实验室自动化以及最优实验设计等。
"通过这些多元化的研究方向,我们希望不断推进AI在化学领域的前沿探索。"科利说。
Q&A
Q1:ShEPhERD模型是如何帮助药物发现的?
A:ShEPhERD是由科利实验室开发的一款计算模型,它通过分析候选药物分子的三维空间形状,评估其与靶蛋白之间的相互作用方式,从而筛选出更具潜力的新型药物分子。该模型的核心优势在于为生成模型引入了药物化学直觉,使其能够基于正确的评判标准进行筛选。目前,ShEPhERD已被多家制药公司应用于新药发现流程中。
Q2:FlowER模型在预测化学反应时有什么特别之处?
A:FlowER是科利实验室开发的一款生成式AI模型,用于预测不同化学原料组合后的反应产物。与其他模型不同的是,FlowER在设计时内嵌了质量守恒定律等基本物理原理,并要求模型对反应路径中各中间步骤的可行性进行评估。这种对反应机理的深度理解,模拟了化学家的思维方式,从而显著提升了模型预测的准确性。
Q3:AI技术在小分子药物发现中具体解决了什么难题?
A:在所有潜在化合物中,估计有10??到10??种可能具有小分子药物价值,传统实验方法根本无法逐一评估。AI技术的引入,使研究人员能够通过计算模型快速分析海量候选化合物、设计具备理想性质的新型分子,并预测合成这些分子的反应路径,大幅提升了药物发现的效率与可能性。
好文章,需要你的鼓励
Locus Robotics宣布收购加拿大温哥华机器人公司Nexera Robotics,将其专有的NeuraGrasp末端执行器技术整合至Locus Array平台。NeuraGrasp融合AI抓取智能、计算机视觉及专利软膜结构,可动态适应不同形状、材质、重量的商品,显著扩大了可自主拣选的SKU类型范围。此次收购将加速Locus Robotics在移动操控领域的技术路线图,推动仓储全流程自动化履约能力迈上新台阶。
ServiceNow研究团队构建的EVA-Bench框架,通过AI对AI的音频通话测试,量化评估语音客服系统在准确性和对话体验两个维度的真实表现,揭示现有系统普遍存在的可靠性缺口。
人形机器人正从原型验证迈向早期商业部署,汽车制造与物流领域预计成为未来十年核心需求市场。IDTechEx预测,相关市场规模将于2030年代初达到约250亿美元,2036年年出货量接近180万台。硬件成本持续下降,均价有望从2024年的约11.47万美元降至2030年的约3.7万美元。高利用率场景下运营成本有望低于5美元/小时,投资回收期可缩短至约6个月。但大规模商业化的关键,仍在于软件能力、任务泛化与系统集成的持续突破。
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。