基因编辑初创公司Metagenomi已采用AWS的Inferentia 2加速器来加速发现拯救生命的潜在疗法,该公司表示其成本比使用英伟达GPU降低了56%。
Metagenomi成立于2018年,正在使用由Jennifer Doudna和Emmanuelle Charpentier开发的诺贝尔奖获奖方法CRISPR,该技术允许对基因序列进行精准编辑。
"基因编辑是一种新的治疗模式,旨在通过在基因层面解决疾病原因来治疗疾病。因此,我们不是治疗症状,而是真正寻求治愈,"Metagenomi发现副总裁Chris Brown告诉记者。
这些疗法依赖于识别酶——本质上是促进化学反应的生物催化剂——这些酶能够结合RNA序列,引导它们到达目的地,在正确位置切割目标DNA,关键是要适合所选择的递送机制。
为了寻找这些酶,该初创公司正在使用一类称为蛋白质语言模型(PLM)的生成式AI,如Progen2,来快速生成数百万个潜在候选者。
"这是关于在百万分之一中找到那一个。因此,如果你能获得两倍的数量,你就将获得最终产品的机会翻倍,"Brown说。
Progen2由Salesforce、约翰霍普金斯大学和哥伦比亚大学的研究人员在2022年开发,是一个自回归Transformer模型,与GPT-2非常相似。但它不是输出文本字符串,而是合成新颖的蛋白质序列。
基础模型约有8亿个参数,与GPT-4或DeepSeek R1等现代大语言模型相比,Progen2非常小,这意味着运行它不需要大量高带宽内存。在试验中,Metagenomi将AWS的Inferentia 2加速器与该生物技术初创公司之前用于运行Progen2的英伟达L40S进行了比较。
Inferentia 2于2023年推出,顾名思义是一款推理优化加速器,配备32GB HBM内存、820 GB/s内存带宽和190 teraFLOPS的16位性能。
相比之下,基于英伟达上一代Ada Lovelace GPU架构的L40S配备48GB GDDR6内存,内存带宽为864 GB/s,16位精度下性能为362 teraFLOPS。
虽然L40S在纸面上优于Inferentia 2,但亚马逊声称其芯片可以通过利用批处理管道AWS Batch和竞价实例来更便宜地完成工作。
"竞价实例通常比按需实例成本低70%左右。由于他们优化的工作流程可以围绕利用AWS Batch的竞价实例进行调度,这真正简化了这些部署...并允许他们调度不同类型的实验全天候运行,"AWS Annapurna Labs团队机器学习业务发展负责人Kamran Khan告诉记者。
Metagenomi和AWS发现,竞价实例、巧妙批处理和廉价芯片的组合可以将Metagenomi的运营成本削减高达56%。
使用Inferentia节省成本的一部分来自更高的可用性。这家云巨头表示,其自主研发芯片的中断率约为5%,而基于英伟达L40S的竞价实例为20%。理论上,这意味着Metagenomi的蛋白质生成批次中只有二十分之一会被中断,而英伟达加速器则是五分之一。
对Brown来说,Inferentia较低的运营成本直接转化为更多的科学研究,增加了发现能够针对不同疾病的酶的可能性。
"我们将一个原本需要一年完成一个项目的问题,转变为我的团队每天或每周可以多次完成的事情,"Brown说。
这次合作还突显出,对于非交互式AI工作负载,更快的硬件并不总是更好——较旧的大幅折扣加速器可能提供更好的价值。
Q&A
Q1:Metagenomi使用什么技术进行基因编辑?
A:Metagenomi使用CRISPR技术进行基因编辑,这是由Jennifer Doudna和Emmanuelle Charpentier开发的诺贝尔奖获奖方法,允许对基因序列进行精准编辑,旨在通过在基因层面解决疾病原因来治疗疾病。
Q2:Progen2是什么?它如何帮助基因编辑?
A:Progen2是由Salesforce、约翰霍普金斯大学和哥伦比亚大学研究人员在2022年开发的自回归Transformer模型,类似GPT-2但专门合成新颖的蛋白质序列。Metagenomi使用这个蛋白质语言模型来快速生成数百万个酶候选者,用于基因编辑治疗。
Q3:为什么亚马逊Inferentia 2比英伟达L40S更具成本效益?
A:虽然英伟达L40S在性能上优于Inferentia 2,但亚马逊通过竞价实例、AWS Batch批处理和更高可用性(中断率仅5%而非20%)实现了更低成本。竞价实例通常比按需实例便宜70%,这种组合让Metagenomi的运营成本降低了56%。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。