英伟达推出GB10工作站：1千万亿次算力、128GB显存、售价超3000美元

英伟达最小的Grace-Blackwell工作站DGX Spark本周正式上市，搭载GB10系统级芯片，可提供高达1千万亿次稀疏FP4性能，配备128GB统一系统内存和200Gbps高速网络。起售价约3000美元，预装Ubuntu Linux系统。该产品主要面向AI和机器人开发者、数据科学家等专业用户，可运行高达2000亿参数的模型。支持双机互联，可处理4050亿参数模型推理。

英伟达最小的Grace-Blackwell工作站本周终于上市，距离这家GPU巨头在CES上首次展示这款AI迷你PC（当时称为Project Digits）已近一年时间。

现在重新命名为DGX Spark，这款大约NUC尺寸的系统搭配了一颗Blackwell GPU，能够提供高达1千万亿次的稀疏FP4性能，配备128GB统一系统内存和200Gbps高速网络连接。

虽然体积小巧，但价格并不便宜，起售价约3000美元。不过，它的目标用户并非主流PC购买者。这些系统还将通过OEM合作伙伴以各种品牌名称销售，甚至不会预装Windows系统。这并非Copilot+ PC，而是搭载定制版Ubuntu Linux系统。

Spark实际上是为AI和机器人开发者、数据科学家以及机器学习研究人员设计的，他们需要一个成本较低但仍能运行高达2000亿参数模型的工作站平台。

这类工作负载对内存需求极大，在消费级显卡上运行并不现实。高端工作站显卡如RTX Pro 6000可配备高达96GB的高速GDDR7内存，但单卡价格就超过8000美元，还不包括其他平台成本。

在发布时，DGX Spark在技术上是英伟达内存容量最大的工作站GPU，至少在基于Blackwell Ultra的DGX Station发布之前是如此。

超级芯片的小型化

DGX Spark采用GB10片上系统芯片，本质上是为旗舰NVL72机架系统提供动力的Grace-Blackwell超级芯片的小型化版本。

正如我们在Hot Chips大会上探讨的，GB10由两个计算芯片组成，通过英伟达专有的NVLink芯片互连技术以600GB/s的速度连接。顺便提一下，这项技术最终将用于将英伟达GPU与英特尔未来的客户端CPU连接，作为两家芯片巨头合作的一部分。

GPU芯片能够提供高达1千万亿次的稀疏FP4算力，或约31万亿次单精度（FP32）算力，在原始性能方面与RTX 5070相当。是的，这款售价550美元的消费级显卡确实提供了两倍多的内存带宽，但由于只有12GB GDDR7内存，在模型和AI工作负载运行方面会受到相当限制。

与英伟达原始的Grace CPU不同，GB10的CPU芯片并未使用Arm的Neoverse V2核心。相反，该芯片是与联发科合作设计的，配备20个ARMv9.2核心。其中10个是Arm的高性能X925核心，其余基于效率优化的Cortex A725核心。

与苹果M系列和AMD Strix Halo SoC类似，GB10的CPU和GPU都由LPDDR5x公共内存池供电。这种计算和内存的紧密耦合使得这些芯片制造商能够实现比当今传统PC平台高两倍以上的带宽。对于GB10，英伟达声称内存带宽为273GB/s。

扩展能力

在Spark上你会发现一个其他系统没有的功能：高速网络连接。就像英伟达的数据中心平台一样，Spark的GB10配备了集成的ConnectX-7网络卡，背面有一对QSFP以太网端口。

虽然理论上可以用于高速网络连接，但这些端口实际上是为连接两台DGX Spark而设计的，有效地将其微调和推理能力翻倍。

在这种配置下，英伟达表示用户能够在4位精度下对高达4050亿参数的模型进行推理。

来自英伟达、宏碁、华硕、戴尔科技、技嘉、慧与、联想和微星的DGX Spark系统将于10月15日开始销售。

Q&A

Q1：DGX Spark工作站的主要配置是什么？

A：DGX Spark搭载GB10芯片，提供1千万亿次稀疏FP4算力或31万亿次单精度算力，配备128GB统一系统内存、200Gbps高速网络连接和273GB/s内存带宽，大约NUC尺寸，预装定制版Ubuntu Linux系统。

Q2：DGX Spark与消费级显卡相比有什么优势？

A：虽然GPU性能与RTX 5070相当，但DGX Spark拥有128GB统一内存，而RTX 5070仅有12GB GDDR7。这使得DGX Spark能够运行高达2000亿参数的大模型，满足AI和机器学习研究的内存需求。

Q3：DGX Spark支持多机连接吗？

A：支持。通过集成的ConnectX-7网络卡和背面的QSFP以太网端口，可以连接两台DGX Spark，有效翻倍其微调和推理能力。在双机配置下，用户可以在4位精度下对高达4050亿参数的模型进行推理。

来源：The Register

0赞

好文章，需要你的鼓励

英伟达推出GB10工作站：1千万亿次算力、128GB显存、售价超3000美元

来源：The Register

2025

10/14

10:18

分享

点赞

亚马逊云科技的“AI毛坯房”，能解决游戏出海80%需求吗？

TE Connectivity 2025财年第四季度销售额增长17%，业绩高于预期销售额、经营利润率及现金流均创下全年新高

月之暗面AI模型注意力机制新突破：让AI更聪明更快的"记忆管理术"

Sora 2应用向美国等地用户全面开放，无需邀请码

Perplexity与Getty Images签署多年许可协议，应对版权争议

AWS业绩超华尔街预期，云基础设施需求持续旺盛

德州核电数据中心合作项目启动，计划2031年投产

高通骁龙X Elite和X Plus笔记本芯片详解

众智有为 致敬同路人｜四川赛狄：从“碰撞”到“同路”，一位华为同路人的蜕变之旅

亚马逊股价大涨，AWS云业务增长加速

Microsoft 365 商业客户无处躲避 Copilot 功能扩张

Google Chrome推出AI操作按钮对抗AI浏览器

Bun 1.3版本整合JavaScript工具链引发开发者争议

Slack将Slackbot升级为AI助手，提供智能工作协助

OpenAI与Broadcom达成四年基础设施合作协议

AI时代如何让IT团队拥抱未来挑战

Meta和Oracle采用英伟达Spectrum-X：以太网进入大型AI工厂时代

AI平台基于学术资料复活古罗马与希腊文明

AI软件开发究竟有多强？智能体编程工具的实力解析

Salesforce全面押注智能体平台Agentforce 360

Flex推出高度集成数据中心参考设计，加速AI基础设施部署

高通收购Arduino背后的芯片销售战略分析

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

众智有为致敬同路人｜四川赛狄：从“碰撞”到“同路”，一位华为同路人的蜕变之旅