英伟达公司表示,它正在将超级计算机从通常所在的庞大数据中心园区中移出,并将其压缩到紧凑的桌面大小工作站中,这些工作站可以放置在开发人员、研究人员和数据科学家的桌面上或旁边。
这就是全新英伟达DGX Station for Windows背后的理念,据称这是全球首款"桌边AI超级计算机"。该产品于今日在台北GTC大会上与Computex展会同期发布,计划在第四季度推出,专为在Windows生态系统中构建和运行强大的、始终在线的智能体而设计,这些智能体能够自动化工作流程。
该系统是与微软公司密切合作开发的,首次将数据中心级AI基础设施引入桌面或桌边形态。它支持Windows上的英伟达OpenShell,这是一个安全的开源智能体运行时环境,集成了微软的安全和容器技术,确保智能体能够在隔离的沙箱环境中安全运行。
英伟达表示,它正在解决企业开发团队面临的一个主要痛点。传统上,最重量级的AI工作负载,如模型训练、微调和大规模推理,都在基于Linux的云数据中心中运行,这些数据中心拥有支持它们所需的基础设施。
然而,财富500强企业的大部分日常业务运营和工程工作流程都在本地基于Windows的系统上运行。通过将其最新架构引入Windows生态系统,DGX Station消除了团队将早期AI工作负载推送到云端的需求,使他们能够在本地构建和部署强大的智能体,同时利用他们信任的工具和安全基础设施。
英伟达企业平台副总裁Chris Marriott表示,企业需要专门的基础设施,使他们能够将智能体直接连接到驱动其业务的应用程序和工作流程。"DGX Station将超级计算级别的AI直接带入Windows,数百万人每天都在这里进行设计、工程、研究和创作。"
DGX Station for Windows由英伟达的GB300 Grace Blackwell Ultra桌面超级芯片驱动,这是Grace Blackwell平台针对机架规模数据中心的定制版本。它将Blackwell Ultra图形处理器与英伟达Grace中央处理器封装在一起,通过NVLink-C2C互连技术连接。
总体而言,该系统提供20 petaflops的FP4性能和高达748 GB的内存。凭借如此强大的计算能力,DGX Station for Windows可以在本地运行高达1万亿参数的前沿模型,或支持数百个智能体在同一平台上同时并行运行。
但这只是基本配置。对于需要运行密集模拟或可视化工作流程的客户,DGX Station for Windows可以与额外的英伟达RTX Pro 6000 Blackwell工作站GPU配对,实现"物理AI工作流程",将强大的计算能力与光线追踪能力相结合。这支持创建不仅能够感知,还能与支持逼真物理效果的虚拟环境交互的智能体。
为了获得更强大的性能,客户可以通过英伟达ConnectX-8 SuperNIC连接多个DGX Station for Windows系统,创建自己的桌面超级计算机集成集群,运行更大规模的工作负载,英伟达表示。
由于每个智能体都在英伟达的OpenShell运行时环境中运行,它们可以被设置为在严格的边界内运行,并设置严格的安全防护措施。OpenShell不依赖容易被绕过的行为系统提示,而是依靠Windows的安全原语为每个智能体创建隔离的沙箱环境。
当用户这样做时,他们的智能体的安全和隐私策略将在系统级别强制执行,防止它们覆盖企业策略或泄露凭证和敏感信息。OpenShell还使管理员能够使用微软的集群管理工具管理他们的智能体。同时,Windows子系统for Linux确保与Linux工具链的兼容性。
微软Windows + 设备执行副总裁Pavan Davuluri表示,DGX Station for Windows的推出建立在两家公司数十年合作伙伴关系的基础上。"今天,我们将这种合作提升到一个新的水平,将Windows的全部功能从轻薄PC扩展到数据中心级工作站,"他说。"这在Windows上解锁了一类全新的AI性能。"
英伟达表示,DGX Station for Windows将在年底前上市。它将提供多种配置,由包括戴尔科技公司、惠普公司、华硕电脑公司、微星国际公司、超微计算机公司等合作伙伴制造的系统。
Q&A
Q1:英伟达DGX Station for Windows是什么产品?
A:这是英伟达推出的全球首款"桌边AI超级计算机",它将数据中心级的AI计算能力压缩到桌面大小的工作站中,可以放置在开发人员的桌面上或旁边。该产品专为在Windows生态系统中构建和运行强大的智能体而设计,计划在2025年第四季度推出。
Q2:DGX Station for Windows的计算性能有多强?
A:该系统由英伟达GB300 Grace Blackwell Ultra桌面超级芯片驱动,提供20 petaflops的FP4性能和高达748 GB的内存。它可以在本地运行高达1万亿参数的前沿模型,或支持数百个智能体在同一平台上同时并行运行。用户还可以通过连接多个系统创建集成集群,运行更大规模的工作负载。
Q3:DGX Station for Windows如何保障智能体运行的安全性?
A:该系统支持英伟达OpenShell运行时环境,这是一个集成了微软安全和容器技术的开源智能体运行时。它依靠Windows的安全原语为每个智能体创建隔离的沙箱环境,在系统级别强制执行安全和隐私策略,防止智能体覆盖企业策略或泄露凭证和敏感信息。
好文章,需要你的鼓励
随着制造商面临提升生产力、质量和韧性的压力,自动化正成为现代工厂运营的核心。全球最大合同制造商之一Flex近期扩大了与Teradyne Robotics的合作,将在自有工厂部署机器人解决方案并为客户制造关键机器人组件。该公司运营卓越与转型总裁分享了从试点项目到大规模实施的经验,探讨协作机器人、自主移动机器人如何平衡灵活性与标准化,以及物理AI在工厂环境中的实际应用前景。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
仓储自动化已进入新阶段,技术挑战从单一任务验证转向规模化部署。Plus One Robotics运营副总裁Christina Gomez-Terry分享了该公司累计完成20亿次拣选后的经验:硬件故障往往在大规模部署后才显现,可维护性和可靠性比峰值性能更重要,人机协作将是长期运营模式,而系统集成可能成为仓储自动化的下一个主要瓶颈。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。