基因编辑初创公司Metagenomi已采用AWS的Inferentia 2加速器来加速发现拯救生命的潜在疗法,该公司表示其成本比使用英伟达GPU降低了56%。
Metagenomi成立于2018年,正在使用由Jennifer Doudna和Emmanuelle Charpentier开发的诺贝尔奖获奖方法CRISPR,该技术允许对基因序列进行精准编辑。
"基因编辑是一种新的治疗模式,旨在通过在基因层面解决疾病原因来治疗疾病。因此,我们不是治疗症状,而是真正寻求治愈,"Metagenomi发现副总裁Chris Brown告诉记者。
这些疗法依赖于识别酶——本质上是促进化学反应的生物催化剂——这些酶能够结合RNA序列,引导它们到达目的地,在正确位置切割目标DNA,关键是要适合所选择的递送机制。
为了寻找这些酶,该初创公司正在使用一类称为蛋白质语言模型(PLM)的生成式AI,如Progen2,来快速生成数百万个潜在候选者。
"这是关于在百万分之一中找到那一个。因此,如果你能获得两倍的数量,你就将获得最终产品的机会翻倍,"Brown说。
Progen2由Salesforce、约翰霍普金斯大学和哥伦比亚大学的研究人员在2022年开发,是一个自回归Transformer模型,与GPT-2非常相似。但它不是输出文本字符串,而是合成新颖的蛋白质序列。
基础模型约有8亿个参数,与GPT-4或DeepSeek R1等现代大语言模型相比,Progen2非常小,这意味着运行它不需要大量高带宽内存。在试验中,Metagenomi将AWS的Inferentia 2加速器与该生物技术初创公司之前用于运行Progen2的英伟达L40S进行了比较。
Inferentia 2于2023年推出,顾名思义是一款推理优化加速器,配备32GB HBM内存、820 GB/s内存带宽和190 teraFLOPS的16位性能。
相比之下,基于英伟达上一代Ada Lovelace GPU架构的L40S配备48GB GDDR6内存,内存带宽为864 GB/s,16位精度下性能为362 teraFLOPS。
虽然L40S在纸面上优于Inferentia 2,但亚马逊声称其芯片可以通过利用批处理管道AWS Batch和竞价实例来更便宜地完成工作。
"竞价实例通常比按需实例成本低70%左右。由于他们优化的工作流程可以围绕利用AWS Batch的竞价实例进行调度,这真正简化了这些部署...并允许他们调度不同类型的实验全天候运行,"AWS Annapurna Labs团队机器学习业务发展负责人Kamran Khan告诉记者。
Metagenomi和AWS发现,竞价实例、巧妙批处理和廉价芯片的组合可以将Metagenomi的运营成本削减高达56%。
使用Inferentia节省成本的一部分来自更高的可用性。这家云巨头表示,其自主研发芯片的中断率约为5%,而基于英伟达L40S的竞价实例为20%。理论上,这意味着Metagenomi的蛋白质生成批次中只有二十分之一会被中断,而英伟达加速器则是五分之一。
对Brown来说,Inferentia较低的运营成本直接转化为更多的科学研究,增加了发现能够针对不同疾病的酶的可能性。
"我们将一个原本需要一年完成一个项目的问题,转变为我的团队每天或每周可以多次完成的事情,"Brown说。
这次合作还突显出,对于非交互式AI工作负载,更快的硬件并不总是更好——较旧的大幅折扣加速器可能提供更好的价值。
Q&A
Q1:Metagenomi使用什么技术进行基因编辑?
A:Metagenomi使用CRISPR技术进行基因编辑,这是由Jennifer Doudna和Emmanuelle Charpentier开发的诺贝尔奖获奖方法,允许对基因序列进行精准编辑,旨在通过在基因层面解决疾病原因来治疗疾病。
Q2:Progen2是什么?它如何帮助基因编辑?
A:Progen2是由Salesforce、约翰霍普金斯大学和哥伦比亚大学研究人员在2022年开发的自回归Transformer模型,类似GPT-2但专门合成新颖的蛋白质序列。Metagenomi使用这个蛋白质语言模型来快速生成数百万个酶候选者,用于基因编辑治疗。
Q3:为什么亚马逊Inferentia 2比英伟达L40S更具成本效益?
A:虽然英伟达L40S在性能上优于Inferentia 2,但亚马逊通过竞价实例、AWS Batch批处理和更高可用性(中断率仅5%而非20%)实现了更低成本。竞价实例通常比按需实例便宜70%,这种组合让Metagenomi的运营成本降低了56%。
好文章,需要你的鼓励
Anchor Browser获得600万美元种子轮融资,专注解决AI代理安全可靠地使用网络的挑战。该公司重新设计浏览器作为云端执行层,为每个AI代理提供独立安全的浏览器环境。与传统浏览器不同,Anchor的b0.dev系统让代理能够规划工作流程并可靠重复执行,将混乱的自动化转变为企业级软件工程。
清华大学研究团队开发的SLA技术通过将AI视频生成中的注意力权重智能分类,对不同重要程度的权重采用差异化计算策略,成功实现了95%的计算量减少和20倍的速度提升,同时保持视频质量不变,为AI视频生成效率优化开辟了新思路。
英国竞争与市场管理局经过九个月调查,将谷歌和苹果的移动平台指定为具有战略市场地位。监管机构表示,两家公司在移动平台领域拥有根深蒂固的市场主导地位,其平台规则可能限制创新和竞争。这一指定使监管机构能够考虑采取针对性干预措施,确保英国应用开发者能够创新和发展业务,但目前尚未引入任何直接要求。
斯坦福大学等机构联合提出多人Nash偏好优化(MNPO),突破传统双人训练局限,让AI在多人游戏环境中学习处理复杂非传递性偏好。该方法通过时间依赖设计,让AI与历史版本对话练习,在所有主要测试中显著超越现有方法,在Arena-Hard中甚至超过GPT-5,为AI对话系统训练提供了更贴近真实世界复杂性的新范式。