AMD在拉斯维加斯的CES展会上发布了针对企业客户的Instinct GPU产品线关键更新和Helios机架级系统,直指GPU霸主英伟达在数据中心领域的主导地位。
1月6日,AMD公司发布了下一代Instinct MI500 GPU以及MI400系列的最新产品Instinct MI400X,专为处理本地AI工作负载而设计。AMD还展示了其Helios机架级系统的更多细节,该系统承诺在单个机架中提供3 AI exaflops的性能。
AMD CEO苏姿丰在主题演讲中表示:"随着AI应用加速普及,我们正在进入yotta级计算时代,这得益于训练和推理需求的前所未有增长。AMD正通过端到端技术领导力、开放平台以及与生态系统合作伙伴的深度协作创新,为AI的下一阶段构建计算基础。"
挑战GPU之王?
英伟达在AI部署领域享有主导地位,成为资金雄厚的超大规模云服务商的首选解决方案。最新报告显示,英伟达在数据中心GPU和AI加速器市场的份额超过90%。
但AMD希望通过专注于寻求在AI需求中平衡性能和成本的小型企业客户来削弱英伟达的GPU垄断。AMD的Instinct产品可以集成到现有机架中,为寻求增量升级的公司提供更具成本效益的选择。
Moor Insights & Strategy副总裁兼首席分析师Matt Kimball向Data Center Knowledge表示:"AMD能否竞争?我认为答案是肯定的。MI440X展示了AMD如何攻击AI的下一个重要前沿:商业企业市场。这可能是最佳的长期机会。"
AMD已经取得显著进展——公司报告称其EPYC云部署同比增长50%,谷歌、微软Azure、甲骨文、AWS等都有产品发布。在数据中心市场,Instinct GPU和EPYC CPU销售大幅增长,在最近几个季度中占AMD收入的近一半。
软件方面的竞争
AMD正在利用其开源ROCm软件对抗英伟达广受欢迎的CUDA。虽然AMD的ROCm正在获得关注,但CUDA仍然是主导解决方案。
Kimball说:"在软件方面,这是ROCm与CUDA的竞争。AMD选择拥抱开放性,如果它想推动采用,这是必须的。而英伟达走的是专有路线。总是有权衡——开源应该有助于推动生态系统支持和采用,而专有解决方案通常会带来更精细调优的系统,获得更好的性能。"
他补充说:"我不认为任何一种方法是错误的。AMD是挑战者,需要推动其平台的采用,而CUDA已经存在了几十年,在开发者社区中享有广泛支持。"
更大的野心
AMD的目标不仅仅是小型企业。Helios系统搭载72个MI455X芯片、EPYC CPU和Pensando Vulcano网卡用于横向扩展网络,将与英伟达的NVL系统竞争数据中心AI工作负载。
Kimball表示:"Helios是一个针对最大型组织的机架级解决方案。它面向超大规模云服务商和像超大规模云服务商一样运营的企业组织。它重约3.5吨,专为极大规模AI设计。"
公司还预览了下一代Instinct MI500 GPU,计划于2027年发布。AMD声称这些芯片将提供比其MI300X GPU产品线高达1000倍的AI性能。MI500 GPU基于下一代AMD CDNA 6架构、先进的2纳米工艺技术和HBM4E内存构建。
Kimball对Instinct MI500的消息评论说:"这是AMD工程和组件世代改进的结合。我更想看到实际性能表现如何。企业如何通过在所有功能中充分利用智能体AI来受益?"
Q&A
Q1:AMD Instinct MI400X GPU有什么特点?
A:AMD Instinct MI400X是MI400系列的最新产品,专为处理本地AI工作负载而设计。它可以集成到现有机架中,为寻求增量升级的企业提供更具成本效益的选择,主要针对需要在性能和成本间取得平衡的中小型企业客户。
Q2:AMD Helios机架级系统性能如何?
A:AMD Helios机架级系统承诺在单个机架中提供3 AI exaflops的性能,搭载72个MI455X芯片、EPYC CPU和Pensando Vulcano网卡。系统重约3.5吨,专为极大规模AI应用设计,主要竞争对手是英伟达的NVL系统。
Q3:AMD如何与英伟达的CUDA竞争?
A:AMD采用开源的ROCm软件对抗英伟达的专有CUDA平台。AMD选择开放性策略来推动平台采用和生态系统支持,而英伟达的专有解决方案虽然能提供更精细调优的系统性能,但AMD作为挑战者需要通过开源方式扩大市场份额。
好文章,需要你的鼓励
2025年AI占据了IT领导者的主要注意力,但现实检验显示,虽然三分之二的组织在生产中使用生成式AI,仅15%报告对收益产生积极影响。2026年,IT领导者将重新校准AI策略,减少技术债务。他们强调情商和人际技能在AI时代的重要性,关注"什么值得自动化"而非"能自动化什么",并致力于以人为中心的AI部署和技术债务管理。
上海AI实验室开发RePro训练方法,通过将AI推理过程类比为优化问题,教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性,显著提升了模型在数学、科学和编程任务上的表现,准确率提升5-6个百分点,同时大幅减少无效推理,为高效AI系统发展提供新思路。
罗技公司因苹果开发者证书过期导致其鼠标产品在Mac系统上停止工作。证书失效不仅使配套应用无法运行,还无法自动更新修复问题。Reddit用户首先发现MX Master 3S鼠标出现故障并找出根本原因。罗技承认这是不可原谅的错误,迅速创建支持页面提供手动修复指南。用户需下载Options+或G HUB的更新补丁安装程序,手动安装后可恢复设备设置和自定义功能。
MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考,实现了最高2.03倍的速度提升和17.4倍的反应延迟改善,成功展示了机器人打乒乓球等高难度任务,为机器人在动态环境中的应用开辟了新可能性。