英国芯片设计公司Arm在周二于旧金山举办的活动中发布了其首款自主硅芯片产品——这是一款真正的芯片,而不是另一个设计蓝图。该公司表示,旗舰客户Meta计划在今年晚些时候大规模部署这款136核CPU。
这款被称为AGI CPU的处理器是Arm公司首个自有品牌的数据中心处理器,专为智能体AI而设计。人工通用智能(AGI)已经到来,而它就是一款CPU。
这一新硬件产品代表了英国芯片设计公司商业模式的重大转变。虽然Arm对数据中心芯片并不陌生,但到目前为止,其参与这些产品的方式主要是授权构建所需的核心IP或指令集架构。
尽管品牌宣传充满炒作色彩,但这款芯片的Arm Neoverse V3核心本身并不会运行AI模型。运行AI模型是GPU或越来越多的高端AI专用集成电路(ASIC)的工作。相反,Arm认为其首款数据中心CPU将为AI智能体提供动力。在这方面,该芯片将直接与英伟达在上周GTC大会上详细介绍的独立Vera CPU和机架系统竞争。
Arm云AI执行副总裁Mohamed Awad表示:"我们认为CPU对于最终实现AGI将是至关重要的。"
虽然GPU在近年来获得了最多关注,但像OpenClaw这样的智能体系统的兴起让通用计算的需求重新进入视野。这些框架需要CPU核心和内存来编写和执行代码、自动化任务,并促进用于训练下一代模型的强化学习。
Arm押注这些智能体的普及将推动CPU需求增长四倍,并将其最新芯片定位为利用这一趋势的产品。
Arm的AGI CPU是一款300瓦的产品,配备136个Neoverse V3核心,时钟频率最高可达3.7 GHz(基础频率3.2 GHz),分布在两个采用台积电3纳米工艺制造的芯片上。该处理器每核心配备2 MB的L2缓存,以及128 MB的共享系统级缓存(SLC)。
据Awad介绍,公司特意努力避免包含会占用芯片面积但最终不会使目标工作负载受益的加速器或功能。
"传统CPU的构建方式担心诸如对旧应用程序的支持等问题,"他说。"我们特意不想添加那些不会在这个设备的使命中得到100%利用的东西。"
他补充道:"这是一个全新的设计,旨在解决所有这些问题。"
与英伟达的Vera不同,Arm选择在其智能体优化处理器中放弃同步多线程,Awad认为每核心一个线程可以实现更确定性的性能扩展。
CPU配备12通道DDR5内存——可能是每个芯片6通道——支持高达8800 MT/s的内存速度。总带宽为825 GB/s,相当于每核心6 GB/s。
与许多现代CPU不同,该芯片的内存和I/O功能集成在与计算相同的芯片上,以最小化延迟。因此,每个插槽将在操作系统中显示为两个不同的NUMA域。
最后,在I/O方面,该处理器配备96条PCIe 6.0连接通道,并支持CXL 3.0。
Meta已经在大规模部署英伟达基于Arm的Grace CPU,并计划使用该公司的Vera芯片,现在也将成为Arm首批主要CPU客户之一。
作为这些努力的一部分,Arm表示已验证了两种不同的OCP机架设计。其中一种是36千瓦风冷机架,配备30个计算刀片,每机架总计8160个核心。
该公司还验证了一个密度更高的200千瓦液冷机架,配备42个八节点服务器,总计45696个核心。作为参考,这是英伟达Vera ETL256 CPU机架22528核心数量的两倍多。
Meta并不是唯一排队等待Arm新处理器的客户。OpenAI、SAP、Cerebras、Cloudflare、F5、SK电信和Rebellions也被列为早期客户。
除了AI智能体,Arm还看到该芯片作为定制加速器头节点的应用,甚至可以作为网络或存储的通用CPU。实际上,包括联想在内的OEM合作伙伴已经在使用该芯片开发19英寸系统。
到目前为止,企业客户在Arm数据中心芯片方面的选择有限,Ampere计算是唯一一家非基于云的参与者。
Arm的AGI CPU计划于今年晚些时候上市。至于它是否真的能带来奇点,那就是另一回事了。
更正:在活动前的简报中,Arm向我们提供了第一种风冷机架的错误数字:实际上是36千瓦,配备30个刀片,总计8160个核心。
Q&A
Q1:Arm的AGI CPU是什么?有什么特别之处?
A:AGI CPU是Arm公司首款自主设计的数据中心处理器,配备136个Neoverse V3核心,专为智能体AI工作负载而优化。与传统CPU不同,它采用全新设计,避免了不必要的功能,专注于AI智能体所需的通用计算能力。
Q2:为什么Arm要进入CPU制造领域?
A:Arm看到了AI智能体的兴起带来的机遇。虽然GPU负责运行AI模型,但智能体系统需要CPU来编写执行代码、自动化任务和进行强化学习。Arm预测这将推动CPU需求增长四倍,因此推出自己的CPU产品来抓住这一趋势。
Q3:哪些公司会使用Arm的AGI CPU?
A:Meta是首批主要客户,计划今年大规模部署。其他早期客户还包括OpenAI、SAP、Cerebras、Cloudflare、F5、SK电信和Rebellions。联想等OEM厂商也在开发基于该芯片的系统产品。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。