Nvidia全面重构数据中心架构迎接AI时代

英伟达CEO黄仁勋在GTC大会上表示，传统数据中心已从"文件存储工厂"转变为"代币生成工厂"。公司推出了面向AI时代的全新数据中心架构，包括Rubin GPU、Vera CPU和Groq推理芯片等新产品。该架构通过五层集成设计降低AI代币生成成本，将数据中心打造成一个巨型AI GPU。英伟达还发布了NVLink互连、BlueField-4存储平台和Dynamo软件等技术，以应对多智能体系统对内存、存储和网络的极高要求。

在GTC大会的主题演讲中，Nvidia CEO黄仁勋回顾经典数据中心时表示："过去数据中心是为文件而建，现在是生产Token的工厂。"

这些老式建筑已经消失，被驱动AI的大型设施所取代。在GTC大会上，Nvidia展示了前瞻性的数据中心架构，包含新的芯片、存储和网络技术。

Nvidia还将目光投向边缘和太空，以提高AI的速度和效率。这种AI驱动的数据中心架构的目标是降低生成Token的成本（Token是AI的货币，描述大语言模型在训练和推理过程中处理的数据单位）。

黄仁勋表示："历史上最大规模的基础设施建设正在进行中。全世界都在竞相构建芯片系统和AI工厂，每延迟一个月就会损失数十亿美元的收入。"

这个集成蓝图包含五个层次：物理基础设施，其次是硅芯片、软件和系统、AI模型以及应用程序。

J. Gold Associates首席分析师Jack Gold表示："Nvidia正在大力推进帮助构建AI数据中心，这至关重要，因为成本和难度正在急剧上升。"

NTT Data全球战略联盟执行董事总经理Sandip Gupta说，Nvidia的数据中心产品现在涵盖了完整的技术栈。"从客户角度来看，如果他们相信集成技术栈，这会让事情变得简单。"

集成数据中心降低了复杂性，并在冷却、网络和存储方面提高了效率。Gupta表示："这取决于企业对单一供应商的依赖程度，还是选择混合搭配的方式。"

随着多智能体系统和OpenClaw等技术的出现，AI复杂性大幅增加。黄仁勋表示，OpenClaw就像HTML和Linux一样重要。这些技术将以前所未有的速度生成Token，同时对网络、内存和存储造成压力。

AI数据具有上下文特性，低效地移动数据会浪费电力和成本。需要新的网络和存储层来智能高效地移动数据。一种称为KV Cache的技术保存了处理智能体AI系统所需的上下文内存。

黄仁勋说："这会对内存造成巨大冲击...对存储系统造成极大压力，这就是我们重新发明存储系统的原因。"

Nvidia的蓝图将数据中心转变为一个巨大的AI GPU。其核心是在GTC大会上发布的Rubin GPU和Vera CPU。Nvidia还推出了新的推理芯片；Groq LPU比GPU具有更高的内存带宽，专为低延迟Token生成而设计。

Nvidia副总裁兼总经理Ian Buck在新闻发布会上表示，新的Vera Rubin NVL72服务器结合了Rubin的极速性能和Groq的内存带宽。

Buck说，AI需要实时访问数据和上下文内存，而传统数据中心缺乏智能体所需的响应能力。

这家GPU制造商将其NVLink互连速度提高了一倍，达到每秒260TB。Nvidia还推出了用于AI原生存储的BlueField-4 STX机架平台，它将GPU内存扩展到整个系统，以提取关键的上下文AI数据。

黄仁勋表示："过去是人类使用存储系统。过去是人类使用SQL。现在AI将使用这些存储系统。"

Nvidia推出了名为Dynamo的软件，它将GPU、LPU、CPU以及内存和存储层作为集成系统进行协调。

黄仁勋还表示，世界首个采用共封装光学器件的Spectrum-X交换机已投入生产。"我们与台积电共同发明了这项工艺技术，"黄仁勋说，并补充道"我们是目前唯一在生产中的公司。"

Q&A

Q1：什么是Token，为什么它对AI数据中心这么重要？

A：Token是AI的货币，描述大语言模型在训练和推理过程中处理的数据单位。现代数据中心已从过去存储文件的地方转变为生产Token的工厂，降低Token生成成本是AI驱动数据中心架构的核心目标。

Q2：Nvidia的新数据中心架构有哪些核心技术？

A：Nvidia的集成蓝图包含五个层次：物理基础设施、硅芯片、软件和系统、AI模型以及应用程序。核心技术包括Rubin GPU、Vera CPU、Groq LPU推理芯片，以及NVLink互连、BlueField-4 STX存储平台和Dynamo协调软件。

Q3：为什么传统数据中心无法满足AI需求？

A：AI需要实时访问数据和上下文内存，而传统数据中心缺乏智能体所需的响应能力。随着多智能体系统和OpenClaw等技术出现，AI将以前所未有的速度生成Token，同时对网络、内存和存储造成巨大压力，需要专门的AI原生架构。

来源：Networkworld

0赞

好文章，需要你的鼓励

Nvidia全面重构数据中心架构迎接AI时代

来源：Networkworld

2026

03/23

16:57

分享

点赞

苹果在印度恢复银行卡支付功能，距暂停已逾四年

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

企业构建可信赖智能体的四个关键策略

谷歌搜索开始使用AI替换新闻标题

数千人出售身份数据训练AI，代价几何？

英伟达CEO黄仁勋欲打造完整AI工厂技术栈霸主地位

微软承认Windows 11需要改进并计划移除部分Copilot功能

马斯克宣布在德州奥斯汀建设Terafab芯片工厂

微软发布智能体AI安全战略，推出Defender、Entra和Purview新功能

英伟达BlueField-4 STX如何打破存储与网络管理边界

AI合规成本或加剧人工智能发展差距

阿里巴巴自研AI芯片出货47万颗，承认性能落后但坚持差异化路线

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: