周二 GTC 大会开幕前,Nvidia 公司首席执行官黄仁勋出人意料地手持 T 恤发射器出现在舞台上,在圣何塞 SAP 中心向超过 2 万名与会者发射卷起的 T 恤。这一幕恰如其分地引出了他随后的主题演讲,直指重新定义整个计算技术栈并使其支持 AI。
正如黄仁勋和他的高管团队本周所阐述的,Nvidia 的愿景是一个需要先扩大规模的 AI 世界。这意味着需要更强大的处理器和网络等组件,然后才能在全球范围内的更多服务器上进行横向扩展。这需要突破硬件极限的先进处理能力,同时构建 AI 驱动的企业。这需要资金、时间和规划,这些都是 Nvidia 在寻求保持其引领下一次计算革命的过程中所进行的长期布局的一部分。
"我们正在建设 AI 工厂和 AI 基础设施,"黄仁勋在主题演讲中表示。"这需要多年的规划。这不像买一台笔记本电脑那么简单。在横向扩展之前,必须先进行纵向扩展。"
Blackwell 升级
Nvidia "纵向扩展"战略的关键要素是 Blackwell Ultra NVL72,这是 Nvidia GPU 平台的最新迭代。黄仁勋发布了对原始 Blackwell 架构的重大升级,该架构旨在处理下一代 AI 推理和代理驱动的工作负载。
Blackwell Ultra 每个数据中心机架将包含惊人的 60 万个组件,并配备 120 千瓦全液冷基础设施。"我们在一个机架中就有一台 1 exaflops 的计算机,"黄仁勋指出。"这是世界上迄今为止最极致的纵向扩展。"
黄仁勋还通过提供额外的纵向扩展架构路线图,让与会者一窥未来。虽然 Blackwell Ultra 集成了 72 个 GPU 的算力,但 Nvidia 的下一代 Rubin 将在明年同期提供 144 个 GPU,并在 2027 年扩展到每机架 576 个 GPU 或 600 千瓦。
尽管 Blackwell 的性能得到提升,但网络仍可能成为瓶颈。周二发布的 Spectrum-X 以太网和 Quantum-X800 InfiniBand 网络系统可为 72 个 Blackwell GPU 中的每一个提供高达每秒 800 GB 的数据吞吐量。
Nvidia 还宣布了 Dynamo,这是一款开源推理软件,旨在提高吞吐量并降低生成大语言模型 token 的成本。通过在预计将达到数千个 GPU 之间协调推理通信,Nvidia 打算在 AI 代理和其他用例增加时提高效率。
"Dynamo 本质上是 AI 工厂的操作系统,"黄仁勋在主题演讲中表示。
揭示 AI 路线图
黄仁勋对运营支持的宣言突显了其公司企业战略的一个关键要素,也是本周 GTC 大会的一个明确主题。最终目标是让企业从传统数据中心转向 AI 工厂,这些高性能计算环境将大规模生成 AI。这种将 AI 视为工业规模生产过程的愿景正在推动 Nvidia 的业务模式演变。
据黄仁勋表示,Nvidia 本身已经成为一个 AI 工厂。在主题演讲次日的媒体简报会上,Nvidia 的 CEO 概述了他的公司如何从处理器制造商转型为其多样化客户群的关键收入驱动者。
"我们不再只是制造芯片了,那是过去的好日子,"黄仁勋说。"我们现在是一个 AI 工厂。工厂帮助客户赚钱。"
在许多方面,Nvidia 现在在科技行业中处于一个独特的位置。它毫不犹豫地提前数年公布其产品计划,而且似乎完全不担心与其供应的客户之间可能存在的竞争。
该公司发布的 Blackwell 和 Rubin 路线图,以及其他几个关键产品领域的计划增强功能,反映了一定程度的透明度,黄仁勋在周三的记者会上特别指出了这一点。
"我们是历史上第一家一次性宣布四代技术的科技公司,"黄仁勋说。"这就像一家公司宣布未来四代智能手机。现在其他人都可以做出规划了。"
赋能生态系统
这是一个不寻常但关键的策略,因为 Nvidia 希望保持其在推动 AI 方面的巨大优势。Nvidia 大胆公布其路线图的举动反映了一种市场理念,即其"大帐篷"方法将避免与购买其系统的客户之间潜在的利益冲突。黄仁勋指出,Nvidia 刻意避免成为一家"解决方案公司",通过将价值创造的后半部分留给客户,它可以与任何客户并肩合作,构建能够交付结果的 AI 平台。
"我们完全可以将我们创造的核心技术让他们整合到他们的核心解决方案中并推向市场,"黄仁勋说。"我们成为了世界上唯一一家与世界上每家 AI 公司都合作的 AI 公司。我们可以以任何方式与任何人合作。我们想要赋能生态系统。这就是为什么每家公司都在这里。"
确实,本周在圣何塞 GTC 展厅漫步,可以与来自 Amazon Web Services Inc.、Microsoft Corp.、Google Cloud、Oracle Corp. 和 Hewlett Packard Enterprise Co. 等公司的代表互动。与会者有机会与 Dell Technologies Inc. 的 Michael Dell 和 ServiceNow Inc. 的 CEO Bill McDermott 等长期科技界名人在会议中心大厅擦肩而过。
去年当 Nvidia 生态系统在圣何塞召开会议时,SiliconANGLE 行业分析师 Dave Vellante 将该活动描述为"在其影响力、愿景、生态系统影响力和对 AI 时代将永久改变世界的广泛认识方面最重要的事件"。一年后,很难说 AI 的影响力有所减弱或 GTC 变得不那么重要。
"去年 GTC 被描述为 AI 的伍德斯托克音乐节,"黄仁勋在开幕日的主题演讲中说。"今年它被描述为 AI 的超级碗。我们现在已经达到了加速计算的临界点。"
好文章,需要你的鼓励
OpenAI 发布三款全新专有语音模型,包括 gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。这些模型基于 GPT-4o 开发,提供更准确的转录和语音合成能力,支持 100 多种语言,可通过 API 集成到第三方应用中。新模型在英语转录准确率方面表现出色,错误率仅为 2.46%,并支持语音定制和情感表达。
Nvidia 推出 DGX Cloud 基准测试工具包,帮助企业和开发者评估其基础设施运行先进 AI 模型的能力。该工具包提供性能测试容器和脚本,可在不同配置下测试 AI 模型性能,支持企业在大规模部署 AI 工作负载前做出明智决策,优化基础设施效能。
Nvidia 宣布与电力行业研发机构 EPRI 合作,利用 AI 技术解决电网面临的挑战。讽刺的是,这些问题主要源于 AI 本身带来的用电需求激增。Open Power AI 联盟将开源特定领域的 AI 模型,以应对电力行业未来的挑战,包括数据中心用电激增、可再生能源整合等问题。
NVIDIA 正全力打造从硬件到软件再到开发者工具的全栈式 AI 解决方案。在 2025 年 GPU 技术大会上,CEO 黄仁勋详细介绍了新一代 Blackwell B300 GPU、企业级 AI 超级计算机以及 AI 推理模型等创新产品,展现了 NVIDIA 在云计算、企业 IT、制造业和机器人等领域的全方位布局,致力于将 AI 技术推广到更广泛的应用场景。