基因编辑初创公司Metagenomi已采用AWS的Inferentia 2加速器来加速发现拯救生命的潜在疗法,该公司表示其成本比使用英伟达GPU降低了56%。
Metagenomi成立于2018年,正在使用由Jennifer Doudna和Emmanuelle Charpentier开发的诺贝尔奖获奖方法CRISPR,该技术允许对基因序列进行精准编辑。
"基因编辑是一种新的治疗模式,旨在通过在基因层面解决疾病原因来治疗疾病。因此,我们不是治疗症状,而是真正寻求治愈,"Metagenomi发现副总裁Chris Brown告诉记者。
这些疗法依赖于识别酶——本质上是促进化学反应的生物催化剂——这些酶能够结合RNA序列,引导它们到达目的地,在正确位置切割目标DNA,关键是要适合所选择的递送机制。
为了寻找这些酶,该初创公司正在使用一类称为蛋白质语言模型(PLM)的生成式AI,如Progen2,来快速生成数百万个潜在候选者。
"这是关于在百万分之一中找到那一个。因此,如果你能获得两倍的数量,你就将获得最终产品的机会翻倍,"Brown说。
Progen2由Salesforce、约翰霍普金斯大学和哥伦比亚大学的研究人员在2022年开发,是一个自回归Transformer模型,与GPT-2非常相似。但它不是输出文本字符串,而是合成新颖的蛋白质序列。
基础模型约有8亿个参数,与GPT-4或DeepSeek R1等现代大语言模型相比,Progen2非常小,这意味着运行它不需要大量高带宽内存。在试验中,Metagenomi将AWS的Inferentia 2加速器与该生物技术初创公司之前用于运行Progen2的英伟达L40S进行了比较。
Inferentia 2于2023年推出,顾名思义是一款推理优化加速器,配备32GB HBM内存、820 GB/s内存带宽和190 teraFLOPS的16位性能。
相比之下,基于英伟达上一代Ada Lovelace GPU架构的L40S配备48GB GDDR6内存,内存带宽为864 GB/s,16位精度下性能为362 teraFLOPS。
虽然L40S在纸面上优于Inferentia 2,但亚马逊声称其芯片可以通过利用批处理管道AWS Batch和竞价实例来更便宜地完成工作。
"竞价实例通常比按需实例成本低70%左右。由于他们优化的工作流程可以围绕利用AWS Batch的竞价实例进行调度,这真正简化了这些部署...并允许他们调度不同类型的实验全天候运行,"AWS Annapurna Labs团队机器学习业务发展负责人Kamran Khan告诉记者。
Metagenomi和AWS发现,竞价实例、巧妙批处理和廉价芯片的组合可以将Metagenomi的运营成本削减高达56%。
使用Inferentia节省成本的一部分来自更高的可用性。这家云巨头表示,其自主研发芯片的中断率约为5%,而基于英伟达L40S的竞价实例为20%。理论上,这意味着Metagenomi的蛋白质生成批次中只有二十分之一会被中断,而英伟达加速器则是五分之一。
对Brown来说,Inferentia较低的运营成本直接转化为更多的科学研究,增加了发现能够针对不同疾病的酶的可能性。
"我们将一个原本需要一年完成一个项目的问题,转变为我的团队每天或每周可以多次完成的事情,"Brown说。
这次合作还突显出,对于非交互式AI工作负载,更快的硬件并不总是更好——较旧的大幅折扣加速器可能提供更好的价值。
Q&A
Q1:Metagenomi使用什么技术进行基因编辑?
A:Metagenomi使用CRISPR技术进行基因编辑,这是由Jennifer Doudna和Emmanuelle Charpentier开发的诺贝尔奖获奖方法,允许对基因序列进行精准编辑,旨在通过在基因层面解决疾病原因来治疗疾病。
Q2:Progen2是什么?它如何帮助基因编辑?
A:Progen2是由Salesforce、约翰霍普金斯大学和哥伦比亚大学研究人员在2022年开发的自回归Transformer模型,类似GPT-2但专门合成新颖的蛋白质序列。Metagenomi使用这个蛋白质语言模型来快速生成数百万个酶候选者,用于基因编辑治疗。
Q3:为什么亚马逊Inferentia 2比英伟达L40S更具成本效益?
A:虽然英伟达L40S在性能上优于Inferentia 2,但亚马逊通过竞价实例、AWS Batch批处理和更高可用性(中断率仅5%而非20%)实现了更低成本。竞价实例通常比按需实例便宜70%,这种组合让Metagenomi的运营成本降低了56%。
好文章,需要你的鼓励
本文揭示了AI时代CIO的七项关键行为特征,基于对多位CIO和AI专家的深度访谈。专家指出,AI精通的CIO需具备实用AI素养、战略视野和变革领导力,能将技术与业务战略对齐,建立强大数据治理基础。文章详细解析了分析型AI、生成式AI和智能体AI三大技术领域,强调数据基础的重要性,并提出CIO应从项目思维转向产品思维,通过跨职能团队实现端到端价值交付。
斯坦福大学等机构联合开发的CIFT系统首次解决了机器人"近视眼"问题,通过精确控制真实数据和合成数据的混合比例,让机器人在陌生环境中的表现提升54%以上。该系统包含多视角视频增强引擎MVAug和数据组合优化策略,能够预测数据失效的"去相干点",确保机器人学习真正重要的任务特征而非环境表象,为实用化通用机器人奠定了重要基础。
尽管苹果在AI竞赛中看似落后,但其私有云计算基础设施展现了技术优势。当行业为追赶大语言模型而降低隐私标准时,苹果坚持原则,开发出保护用户数据隐私的技术方案。谷歌最新宣布的类似实施方案验证了苹果技术路线的正确性,这可能推动其他AI实验室采用相同做法,为用户隐私带来重大胜利。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。