在本月初于圣何塞举办的AMD AI推进大会上,首席执行官苏姿丰及其团队展示了公司在AI多个方面的进展。他们在硬件和软件领域都有重要发布,包括GPU的显著性能提升、ROCm开发平台的持续进步以及即将推出的机架级基础设施。会上多次提及对客户和合作伙伴的信任与牢固关系,这令人印象深刻,同时大量强调开放硬件和开放开发生态系统,但我认为这对AMD来说并非明显优势。
总体而言,此次活动展现了AMD如何为客户和开发者推进技术发展。在苏姿丰领导下,AMD的行事风格是制定清晰、雄心勃勃的计划并加以执行。她的"言行一致"比率很高,公司说到做到。这正是持续削弱英伟达在数据中心AI GPU市场主导地位所必需的。我在AI推进大会上看到的内容比去年更增强了我的信心,尽管仍有一些差距需要解决。
AMD的AI市场机遇与全栈战略
苏姿丰在台上首先描述了当今AI芯片市场令人震惊的增长背景。到2028年,这一芯片行业细分市场的总可及市场规模将达到5000亿美元,整个AI加速器市场年复合增长率为60%。AI推理子市场——AMD在此领域与英伟达竞争处于更有利地位——年复合增长率达80%。
AMD正在为自己开拓更大的市场空间。正如苏姿丰指出的,其Instinct GPU被十大AI公司中的七家使用,为微软Office、Facebook、Zoom、Netflix、Uber、Salesforce和SAP提供AI驱动。其EPYC服务器CPU继续创造创纪录的市场份额(上季度达40%),公司已建立完整技术栈来支持AI雄心。我特别要指出ZT Systems收购以及Pensando DPU和Pollara NIC的推出。
GPU是数据中心AI的核心,AMD的新MI350系列成为此次活动焦点。虽然这些芯片原计划第三季度出货,但苏姿丰表示实际上6月份就开始了批量出货,合作伙伴将在第三季度推出平台和公有云实例。当听到MI350相比上一代性能提升4倍时,现场爆发出欢呼声。AMD表示其高端MI355X GPU在内存方面比英伟达B200高出1.6倍,计算吞吐量高出2.2倍,每美元代币数多40%。
从另一个角度看,单个MI355X可运行5200亿参数模型。当苏姿丰和其他演讲者展望MI400系列及后续产品可能实现10倍更好性能时,我并不感到意外。这让我们进入了单个GPU运行万亿参数模型的理想境界。
顺便说一下,AMD一秒钟都没有忘记自己是一家CPU公司。计划于2026年上市的EPYC Venice处理器在各方面都应该更出色——256个高性能核心,比当前一代计算性能高70%等等。
AMD的2026年机架级平台和当前软件进展
硬件方面,最大的发布是AMD计划2026年交付的Helios机架级GPU产品。这是件大事,我想强调在液冷机架中整合高性能CPU(EPYC Venice)、GPU(MI400)和网络芯片(下一代Pensando Vulcano NIC)的难度。这也是对抗英伟达的绝佳方式。
软件方面,AMD人工智能集团高级副总裁Vamsi Boppana宣布了ROCm 7的到来,这是公司GPU开源软件平台的最新版本。与ROCm 6相比,推理性能提升3.5倍。Boppana强调AMD软件更新频率极高,每两周发布新功能。他还宣布了AMD开发者云,使开发者可以从任何地方访问AMD GPU来测试想法。
AMD在AI领域的成功之处
机架级平台发布——我们不应过早乐观,也不知道Helios在市场上表现如何。但我对团队交付这个极具挑战性项目的能力有信心。
ROCm进展——这至少与机架级硬件开发同样令人兴奋。虽然过去2.5年AI革命期间行业关注主要在GPU上,但实际上软件与硬件同样重要。
AI训练——去年AMD谈论训练和推理,但客户只谈推理。今年的对比很明显:Meta、微软和Cohere等公司的技术领导者强调他们正在使用AMD GPU进行训练,不仅仅是推理。
存在的问题和挑战
NIM微服务——英伟达的NIM微服务让组织更容易在云端、数据中心等地方部署基础模型。而我还没有看到AMD在这个领域有任何能够对抗英伟达优势的产品。
"开放"理念——虽然AMD认为"开放"技术通常在现代信息技术历史中获胜是正确的,但在商用GPU的具体案例中,开放性在过去20多年中并未获胜。
有待观察的战略要素
机架级生态系统参与、存储解决方案、企业GPU进展、新超大规模云服务商的缺席等都是需要AMD进一步明确的领域。
尽管存在这些问题,AMD正在做一些令人惊叹的事情,我对公司的进展印象深刻。苏姿丰坦率地描述了我们正在经历的AI革命步伐——"不同于现代计算中我们见过的任何东西,不同于我们职业生涯中见过的任何东西,坦率地说,不同于我们一生中见过的任何东西。"
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。