扩大规模:Nvidia 通过新产品重新定义计算技术栈,打造 AI 工厂

在GTC大会上,英伟达CEO黄仁勋宣布了新一代Blackwell Ultra GPU平台和网络系统,旨在构建"AI工厂"。英伟达的战略是先扩大规模(提升单一设备性能),再扩展规模(增加服务器数量),以推动工业级AI生产,为企业客户创造价值。

周二 GTC 大会开幕前,Nvidia 公司首席执行官黄仁勋出人意料地手持 T 恤发射器出现在舞台上,在圣何塞 SAP 中心向超过 2 万名与会者发射卷起的 T 恤。这一幕恰如其分地引出了他随后的主题演讲,直指重新定义整个计算技术栈并使其支持 AI。

正如黄仁勋和他的高管团队本周所阐述的,Nvidia 的愿景是一个需要先扩大规模的 AI 世界。这意味着需要更强大的处理器和网络等组件,然后才能在全球范围内的更多服务器上进行横向扩展。这需要突破硬件极限的先进处理能力,同时构建 AI 驱动的企业。这需要资金、时间和规划,这些都是 Nvidia 在寻求保持其引领下一次计算革命的过程中所进行的长期布局的一部分。

"我们正在建设 AI 工厂和 AI 基础设施,"黄仁勋在主题演讲中表示。"这需要多年的规划。这不像买一台笔记本电脑那么简单。在横向扩展之前,必须先进行纵向扩展。"

Blackwell 升级

Nvidia "纵向扩展"战略的关键要素是 Blackwell Ultra NVL72,这是 Nvidia GPU 平台的最新迭代。黄仁勋发布了对原始 Blackwell 架构的重大升级,该架构旨在处理下一代 AI 推理和代理驱动的工作负载。

Blackwell Ultra 每个数据中心机架将包含惊人的 60 万个组件,并配备 120 千瓦全液冷基础设施。"我们在一个机架中就有一台 1 exaflops 的计算机,"黄仁勋指出。"这是世界上迄今为止最极致的纵向扩展。"

黄仁勋还通过提供额外的纵向扩展架构路线图,让与会者一窥未来。虽然 Blackwell Ultra 集成了 72 个 GPU 的算力,但 Nvidia 的下一代 Rubin 将在明年同期提供 144 个 GPU,并在 2027 年扩展到每机架 576 个 GPU 或 600 千瓦。

尽管 Blackwell 的性能得到提升,但网络仍可能成为瓶颈。周二发布的 Spectrum-X 以太网和 Quantum-X800 InfiniBand 网络系统可为 72 个 Blackwell GPU 中的每一个提供高达每秒 800 GB 的数据吞吐量。

Nvidia 还宣布了 Dynamo,这是一款开源推理软件,旨在提高吞吐量并降低生成大语言模型 token 的成本。通过在预计将达到数千个 GPU 之间协调推理通信,Nvidia 打算在 AI 代理和其他用例增加时提高效率。

"Dynamo 本质上是 AI 工厂的操作系统,"黄仁勋在主题演讲中表示。

揭示 AI 路线图

黄仁勋对运营支持的宣言突显了其公司企业战略的一个关键要素,也是本周 GTC 大会的一个明确主题。最终目标是让企业从传统数据中心转向 AI 工厂,这些高性能计算环境将大规模生成 AI。这种将 AI 视为工业规模生产过程的愿景正在推动 Nvidia 的业务模式演变。

据黄仁勋表示,Nvidia 本身已经成为一个 AI 工厂。在主题演讲次日的媒体简报会上,Nvidia 的 CEO 概述了他的公司如何从处理器制造商转型为其多样化客户群的关键收入驱动者。

"我们不再只是制造芯片了,那是过去的好日子,"黄仁勋说。"我们现在是一个 AI 工厂。工厂帮助客户赚钱。"

在许多方面,Nvidia 现在在科技行业中处于一个独特的位置。它毫不犹豫地提前数年公布其产品计划,而且似乎完全不担心与其供应的客户之间可能存在的竞争。

该公司发布的 Blackwell 和 Rubin 路线图,以及其他几个关键产品领域的计划增强功能,反映了一定程度的透明度,黄仁勋在周三的记者会上特别指出了这一点。

"我们是历史上第一家一次性宣布四代技术的科技公司,"黄仁勋说。"这就像一家公司宣布未来四代智能手机。现在其他人都可以做出规划了。"

赋能生态系统

这是一个不寻常但关键的策略,因为 Nvidia 希望保持其在推动 AI 方面的巨大优势。Nvidia 大胆公布其路线图的举动反映了一种市场理念,即其"大帐篷"方法将避免与购买其系统的客户之间潜在的利益冲突。黄仁勋指出,Nvidia 刻意避免成为一家"解决方案公司",通过将价值创造的后半部分留给客户,它可以与任何客户并肩合作,构建能够交付结果的 AI 平台。

"我们完全可以将我们创造的核心技术让他们整合到他们的核心解决方案中并推向市场,"黄仁勋说。"我们成为了世界上唯一一家与世界上每家 AI 公司都合作的 AI 公司。我们可以以任何方式与任何人合作。我们想要赋能生态系统。这就是为什么每家公司都在这里。"

确实,本周在圣何塞 GTC 展厅漫步,可以与来自 Amazon Web Services Inc.、Microsoft Corp.、Google Cloud、Oracle Corp. 和 Hewlett Packard Enterprise Co. 等公司的代表互动。与会者有机会与 Dell Technologies Inc. 的 Michael Dell 和 ServiceNow Inc. 的 CEO Bill McDermott 等长期科技界名人在会议中心大厅擦肩而过。

去年当 Nvidia 生态系统在圣何塞召开会议时,SiliconANGLE 行业分析师 Dave Vellante 将该活动描述为"在其影响力、愿景、生态系统影响力和对 AI 时代将永久改变世界的广泛认识方面最重要的事件"。一年后,很难说 AI 的影响力有所减弱或 GTC 变得不那么重要。

"去年 GTC 被描述为 AI 的伍德斯托克音乐节,"黄仁勋在开幕日的主题演讲中说。"今年它被描述为 AI 的超级碗。我们现在已经达到了加速计算的临界点。"

来源:SiliconANGLE

0赞

好文章,需要你的鼓励

2025

03/21

15:58

分享

点赞

邮件订阅