AI芯片领域再现重磅动态。亚马逊云科技(AWS)宣布,Meta已签署协议,将采用数百万颗AWS Graviton芯片来支撑其持续增长的AI算力需求。
值得注意的是,AWS Graviton是基于ARM架构的CPU(中央处理器,负责通用计算任务),而非GPU(图形处理器)。
尽管GPU仍是训练大型模型的主流芯片,但随着模型训练完成后,构建于其上的AI智能体正在改变所需的芯片类型。智能体会产生高强度计算负载,包括实时推理、代码编写、搜索以及多步骤任务中的智能体协调管理。AWS表示,最新一代Graviton芯片正是专为应对AI相关计算需求而设计的。
此次合作意味着Meta的更多资金将流向AWS,而非谷歌云等竞争对手。去年8月,Meta与谷歌云签署了一项为期六年、价值100亿美元的合作协议,而在此之前,Meta主要是AWS的客户,同时也使用微软Azure。
有意思的是,AWS选择在谷歌云Next大会刚刚落幕之际宣布这一交易,颇有几分对云计算对手暗送"会心一笑"的意味。当然,谷歌自身也研发定制AI芯片,并在此次大会上发布了新版本。
事实上,亚马逊自研的AI GPU——Trainium同样不可忽视。尽管名字带有"训练"之意,但该芯片实际上兼顾训练与推理两大阶段——推理是指模型完成训练后,对提示词进行实时处理的环节。然而,Trainium的大量资源已被Anthropic提前锁定。这家Claude大语言模型的开发商本月初宣布,将在未来十年内斥资1000亿美元在AWS上运行工作负载,并重点使用Trainium芯片;作为回报,亚马逊同意再向Anthropic追加投资50亿美元,累计投资总额达130亿美元。
综合来看,此次Meta合作案让亚马逊得以将这一大型AI客户作为自研CPU实力的有力佐证。AWS Graviton直接对标英伟达最新推出的Vera CPU——后者同样基于ARM架构,专为AI智能体工作负载而设计。两者的核心区别在于:英伟达面向企业和云服务商(包括AWS)销售芯片及AI系统,而AWS则仅通过云服务的方式向外提供芯片访问权限。
本月早些时候,亚马逊CEO安迪·贾西在年度股东信中直接向英伟达和英特尔发起挑战,表示企业客户需要更高性价比的AI算力方案,并明确表态将凭借这一优势争夺市场。这也意味着,亚马逊内部芯片研发团队承受的压力前所未有——上个月,我们曾独家探访了该团队的实验室。
Q&A
Q1:AWS Graviton芯片和GPU有什么区别?为什么Meta要用CPU来跑AI?
A:AWS Graviton是基于ARM架构的CPU,负责通用计算任务,而GPU主要用于训练大型模型。随着AI智能体的兴起,实时推理、代码编写、搜索等高强度计算任务越来越多,最新一代Graviton芯片正是专为这类AI相关计算需求而设计,能够高效处理智能体的多步骤任务协调工作,因此Meta选择大规模采购Graviton来支撑其AI业务扩张。
Q2:Meta为什么从谷歌云转向AWS?
A:Meta此前主要是AWS客户,去年8月才与谷歌云签署了六年、100亿美元的合作协议。此次Meta与AWS签署Graviton芯片大单,意味着更多资金重新回流到AWS。AWS还特意选在谷歌云Next大会刚结束时宣布这一消息,竞争意味十足。两家云巨头均拥有自研AI芯片,正围绕大型AI客户展开激烈争夺。
Q3:亚马逊自研的Trainium芯片和Graviton有什么不同?
A:Trainium是亚马逊自研的AI GPU,支持模型训练和推理两大阶段;而Graviton是ARM架构的CPU,专注于AI智能体的计算工作负载。目前Trainium的大量资源已被Anthropic以"未来十年斥资1000亿美元"的协议锁定,因此亚马逊借助Graviton来承接Meta的AI需求,同时也将其作为与英伟达Vera CPU竞争的重要筹码。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。