Meta计划在未来数年内,部署数千万个亚马逊云服务(AWS)Graviton 5 CPU核心。这一多年合作协议将使这家社交媒体巨头跻身AWS自研芯片有史以来最大规模的企业用户之列。
这批算力资源将主要用于支撑Meta的智能体AI部署。尽管GPU在训练和运行生成式AI模型方面仍不可或缺,但驱动这些模型运转所需的软件框架依然依赖CPU来处理。
亚马逊最新款Graviton处理器搭载192个Arm Neoverse V3核心,配备了更大容量的L3缓存,并支持最高DDR5 8,800 MT/s的内存规格。相比上一代Graviton 4,这一组合实现了约25%的性能提升。
Meta基础设施负责人桑托什·贾纳丹(Santosh Janardhan)在声明中表示,与AWS的此次合作是公司推进计算资源多元化战略的重要举措。"随着我们持续扩大Meta AI野心背后的基础设施规模,计算资源的多元化已成为一项战略必需。AWS多年来一直是我们值得信赖的云合作伙伴。"他说道。
Meta积极布局多元化计算资源的迹象并不难察觉。过去数月间,这家公司持续向基于Arm架构的CPU厂商靠拢。
今年2月,Meta披露自己是率先大规模部署英伟达独立Grace CPU的企业之一;此后,Meta又宣布计划部署英伟达全新的88核Vera CPU。
今年3月,Arm公司透露,曾与Meta密切合作,共同设计其首款面向数据中心的自有品牌芯片——"AGI CPU"。这款芯片将136个Neoverse V3核心集成于一颗300瓦的处理器中。
Arm的新款芯片预计将于今年晚些时候才会正式进驻Meta数据中心。然而,AGI CPU与AWS Graviton 5在架构上的高度相似性,意味着Meta眼下可以先通过AWS完成相关工作负载的部署,等到Arm自研芯片正式就绪后,再将这些负载迁移回自有数据中心。
Arm架构数据中心处理器的快速普及,尤其是在AI应用领域的大规模落地,预计将为这家英国芯片设计商带来显著的市场份额增长。
市场研究机构Counterpoint Research的分析师近期预测,到2029年,基于Arm架构的CPU将占据AI ASIC服务器CPU市场约90%的份额。
"尽管x86架构目前在AI服务器基础设施中仍占据举足轻重的地位,但我们逐代对比的分析表明,这一固有格局正在迅速向基于Arm的自研设计方向转变。"Counterpoint分析师吴大卫(David Wu)在一篇博客文章中写道。
这一转变可以说从2023年英伟达Grace CPU的发布就已拉开序幕。这款基于Arm架构的处理器,此后在英伟达众多GPU系统中逐步取代了英特尔和AMD的x86产品。
去年12月,AWS宣布在其Trainium 3 AI机架系统中以自研芯片取代英特尔CPU;就在本周,谷歌也宣布将以自研的基于Arm架构的Axion芯片,替换其TPU集群中原有的x86处理器。
Q&A
Q1:Meta为什么要大规模采购AWS的Graviton 5 CPU,而不是继续使用GPU?
A:GPU主要用于训练和运行生成式AI模型,但驱动这些模型所需的软件框架仍然依赖CPU运行。Meta此次大规模部署Graviton 5 CPU,主要是为了支撑其智能体AI的运行需求,同时也是公司推进计算资源多元化战略的一部分,避免过度依赖单一供应商或架构。
Q2:AWS Graviton 5相比上一代有哪些提升?
A:AWS Graviton 5搭载192个Arm Neoverse V3核心,配备更大的L3缓存,支持最高DDR5 8,800 MT/s的内存规格,相比Graviton 4整体性能提升约25%。这些改进使其在处理大规模AI软件框架和智能体应用时具备更强的计算能力。
Q3:Arm架构CPU为何能在AI服务器市场快速崛起,未来市场前景如何?
A:Arm架构CPU凭借更高的能效比和灵活的自研定制能力,正在逐步替代传统x86处理器。英伟达、亚马逊、谷歌、Meta等科技巨头纷纷转向Arm架构自研芯片。据Counterpoint Research预测,到2029年,Arm架构CPU将占据AI ASIC服务器CPU市场约90%的份额,市场增长前景十分显著。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。