作为ChatGPT和谷歌Gemini等热门工具背后的技术,基于大语言模型(LLM)的生成式AI正在彻底改变各个行业,药物发现领域当然也不例外。通过运用AI之力以解码并操纵生物及化学语言,制药企业如今可以更快、更加经济高效地开发新药。在本文中,我们将一同了解生成式AI如何改变药物发现、加速开发过程并降低研发成本。
从传统角度讲,生成式AI的主要作用在于生成人类语言。但除此之外,其潜力早已跨过这条连坐,涵盖了复杂的生物和化学语言。举例来说,人类DNA可以看作是一条由30亿个字母组成的序列,这就形成了一种独特的语言。同样的,作为生命基石的蛋白质也拥有自己的字母表,也就是20种氨基酸。这些化学物质均可使用简化分子线性输入规范(SMILES)来定义其结构。
生成式AI技术能够解释这些语言,帮助发现并开发出新的药物疗法。通过将大模型类型的方法应用于这些生物和化学语言,AI模型能够发现以往无法观察到的见解,加快药物发现过程并显著降低成本。鉴于新药疗法的失败率很高——一般只有10%的药物能够顺利通过临床试验——任何有助于提高效率和降低时间和成本的技术,都将为整个产业贡献巨大价值。
生成式AI可以应用于药物发现的各个阶段:
1. 目标识别:第一阶段是识别待治疗的疾病或症状。生成式AI可以分析基因组数据,从而了解导致疾病或其他潜在生物过程的基因。这将有助于确定新药开发的确切目标。
2. 线索生成:第二阶段是生成潜在线索,也就是针对已识别疾病的化学物质或蛋白质。但由于可能的化学物质(超过10^60种)与蛋白质(超过10^160种)数量极多,因此导致这项任务颇为艰难。生成式AI技术能够筛选其中的可能性,并生成具有所需特性的新型化合物,从而产生大量可供探索的线索。
3. 优化:在第三阶段,需要对潜在候选药物进行功效测试。生成式AI可以协助这一大规模筛选过程。例如,英伟达与Recursion Pharmaceuticals的合作就表现出在一周之内,对超过2.8千万亿种小分子靶标对进行筛选的能力。如果用传统方法处理,这项任务需要10万年才能完成。
生成式AI将使制药公司以前所未有的规模、速度和准确性探索潜在新药,大大加快临床试验的进展。
目前有多家公司在运用生成式AI进行药物发现方面处于领先地位。一个著名案例就是Insilico Medicine,他们利用AI开发出一种治疗特发性肺纤维化的药物,这是一种会导致肺功能逐渐衰退的罕见疾病。传统上,整个研发过程需要六年时间,耗资超过4亿美元。但借助生成式AI,Insilico将成本降低至十分之一,并把研发周期缩短到了两年半。
Insilico将AI方案应用在临床前药物发现流程中的各个阶段,包括识别目标分子、生成新型候选药物以及预测临床试验结果。他们还成功开发出一种对所有变体均有疗效的AI生成COVID-19药物,并启动了30多个针对各类疾病(包括癌症)的其他项目。
生成式AI对药物发现具有变革性的影响,有望以极低的成本快速治愈多种疾病。凭借AI解码复杂生物与化学语言的能力,我们也许可以期待未来新药的开发流程将更快、更高效也更成功。生成式AI代表的不只是一项技术进步,更将颠覆整个医疗保健行业,在为全球患者带来更佳诊疗效果的同时,为未来药物的开发探明前所未有的道路。
好文章,需要你的鼓励
还在为渲染一个3D模型等上几小时吗?还在纠结移动办公就得牺牲性能吗?当AI遇上专业工作站,传统设计流程的游戏规则正在被改写。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。