英伟达推出GB10工作站：1千万亿次算力、128GB显存、售价超3000美元

英伟达最小的Grace-Blackwell工作站DGX Spark本周正式上市，搭载GB10系统级芯片，可提供高达1千万亿次稀疏FP4性能，配备128GB统一系统内存和200Gbps高速网络。起售价约3000美元，预装Ubuntu Linux系统。该产品主要面向AI和机器人开发者、数据科学家等专业用户，可运行高达2000亿参数的模型。支持双机互联，可处理4050亿参数模型推理。

英伟达最小的Grace-Blackwell工作站本周终于上市，距离这家GPU巨头在CES上首次展示这款AI迷你PC（当时称为Project Digits）已近一年时间。

现在重新命名为DGX Spark，这款大约NUC尺寸的系统搭配了一颗Blackwell GPU，能够提供高达1千万亿次的稀疏FP4性能，配备128GB统一系统内存和200Gbps高速网络连接。

虽然体积小巧，但价格并不便宜，起售价约3000美元。不过，它的目标用户并非主流PC购买者。这些系统还将通过OEM合作伙伴以各种品牌名称销售，甚至不会预装Windows系统。这并非Copilot+ PC，而是搭载定制版Ubuntu Linux系统。

Spark实际上是为AI和机器人开发者、数据科学家以及机器学习研究人员设计的，他们需要一个成本较低但仍能运行高达2000亿参数模型的工作站平台。

这类工作负载对内存需求极大，在消费级显卡上运行并不现实。高端工作站显卡如RTX Pro 6000可配备高达96GB的高速GDDR7内存，但单卡价格就超过8000美元，还不包括其他平台成本。

在发布时，DGX Spark在技术上是英伟达内存容量最大的工作站GPU，至少在基于Blackwell Ultra的DGX Station发布之前是如此。

超级芯片的小型化

DGX Spark采用GB10片上系统芯片，本质上是为旗舰NVL72机架系统提供动力的Grace-Blackwell超级芯片的小型化版本。

正如我们在Hot Chips大会上探讨的，GB10由两个计算芯片组成，通过英伟达专有的NVLink芯片互连技术以600GB/s的速度连接。顺便提一下，这项技术最终将用于将英伟达GPU与英特尔未来的客户端CPU连接，作为两家芯片巨头合作的一部分。

GPU芯片能够提供高达1千万亿次的稀疏FP4算力，或约31万亿次单精度（FP32）算力，在原始性能方面与RTX 5070相当。是的，这款售价550美元的消费级显卡确实提供了两倍多的内存带宽，但由于只有12GB GDDR7内存，在模型和AI工作负载运行方面会受到相当限制。

与英伟达原始的Grace CPU不同，GB10的CPU芯片并未使用Arm的Neoverse V2核心。相反，该芯片是与联发科合作设计的，配备20个ARMv9.2核心。其中10个是Arm的高性能X925核心，其余基于效率优化的Cortex A725核心。

与苹果M系列和AMD Strix Halo SoC类似，GB10的CPU和GPU都由LPDDR5x公共内存池供电。这种计算和内存的紧密耦合使得这些芯片制造商能够实现比当今传统PC平台高两倍以上的带宽。对于GB10，英伟达声称内存带宽为273GB/s。

扩展能力

在Spark上你会发现一个其他系统没有的功能：高速网络连接。就像英伟达的数据中心平台一样，Spark的GB10配备了集成的ConnectX-7网络卡，背面有一对QSFP以太网端口。

虽然理论上可以用于高速网络连接，但这些端口实际上是为连接两台DGX Spark而设计的，有效地将其微调和推理能力翻倍。

在这种配置下，英伟达表示用户能够在4位精度下对高达4050亿参数的模型进行推理。

来自英伟达、宏碁、华硕、戴尔科技、技嘉、慧与、联想和微星的DGX Spark系统将于10月15日开始销售。

Q&A

Q1：DGX Spark工作站的主要配置是什么？

A：DGX Spark搭载GB10芯片，提供1千万亿次稀疏FP4算力或31万亿次单精度算力，配备128GB统一系统内存、200Gbps高速网络连接和273GB/s内存带宽，大约NUC尺寸，预装定制版Ubuntu Linux系统。

Q2：DGX Spark与消费级显卡相比有什么优势？

A：虽然GPU性能与RTX 5070相当，但DGX Spark拥有128GB统一内存，而RTX 5070仅有12GB GDDR7。这使得DGX Spark能够运行高达2000亿参数的大模型，满足AI和机器学习研究的内存需求。

Q3：DGX Spark支持多机连接吗？

A：支持。通过集成的ConnectX-7网络卡和背面的QSFP以太网端口，可以连接两台DGX Spark，有效翻倍其微调和推理能力。在双机配置下，用户可以在4位精度下对高达4050亿参数的模型进行推理。

来源：The Register

0赞

好文章，需要你的鼓励

英伟达推出GB10工作站：1千万亿次算力、128GB显存、售价超3000美元

来源：The Register

2025

10/14

10:18

分享

点赞

信任、技术、人为因素：网络韧性的基石

人类主导权应引导AI发展而非存在性恐惧

Google在Gemini中推出AI图像检测工具：能识别AI生成内容吗？

Meta申请电力交易许可以加速AI数据中心电力供应

研究员破解AI聊天机器人训练数据来源之谜

不止于数学：实际部署是筑牢后量子安全的关键环节

中国基础设施和运营领导者培养员工生成式人工智能技能的三大举措

领英ConnectIn 2025大会聚焦人才、技术与信任的三重驱动

ManageEngine卓豪携手DeepSeek，为中国企业强化AI驱动的IT管理能力

Brave浏览器AI助手Leo引入可信执行环境增强隐私保护

OpenAI与富士康合作开发AI数据中心套件

Solidigm：NAND行业面临晶圆厂短缺困境

Bun 1.3版本整合JavaScript工具链引发开发者争议

Slack将Slackbot升级为AI助手，提供智能工作协助

OpenAI与Broadcom达成四年基础设施合作协议

AI时代如何让IT团队拥抱未来挑战

Meta和Oracle采用英伟达Spectrum-X：以太网进入大型AI工厂时代

AI平台基于学术资料复活古罗马与希腊文明

AI软件开发究竟有多强？智能体编程工具的实力解析

Salesforce全面押注智能体平台Agentforce 360

Flex推出高度集成数据中心参考设计，加速AI基础设施部署

高通收购Arduino背后的芯片销售战略分析

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: