NVIDIA Blackwell 现已在云端全面可用

CoreWeave 推出全球首个基于 NVIDIA GB200 NVL72 的云实例，助力开启 AI 推理的新纪元。

AI 推理模型和智能代理正在改变各个行业，但要充分发挥其潜力并实现规模化，需要海量的计算能力和优化的软件支持。"推理"过程涉及多个模型，会生成大量额外的 Token，需要具备高速通信、内存和计算能力相结合的基础设施，以确保实时、高质量的结果。

为满足这一需求，CoreWeave 推出了基于 NVIDIA GB200 NVL72 的实例，成为首个将 NVIDIA Blackwell 平台推向市场的云服务提供商。

借助机架级 NVIDIA NVLink 连接的 72 个 NVIDIA Blackwell GPU 和 36 个 NVIDIA Grace CPU，以及可通过 NVIDIA Quantum-2 InfiniBand 网络扩展至 110,000 个 GPU，这些实例提供了构建和部署下一代 AI 推理模型和智能代理所需的规模和性能。

CoreWeave 上的 NVIDIA GB200 NVL72

NVIDIA GB200 NVL72 是一个液冷的机架级解决方案，具有 72 GPU NVLink 域，使这 72 个 GPU 能够作为一个巨大的 GPU 协同工作。

NVIDIA Blackwell 具有多项技术突破，可加速推理 Token 的生成，提升性能的同时降低服务成本。例如，第五代 NVLink 在单个 72 GPU NVLink 域中提供 130TB/s 的 GPU 带宽，第二代 Transformer 引擎支持 FP4，在保持高精度的同时实现更快的 AI 性能。

CoreWeave 的托管云服务组合专为 Blackwell 打造。CoreWeave Kubernetes Service 通过公开 NVLink 域 ID 优化工作负载编排，确保在同一机架内高效调度。基于 Kubernetes 的 Slurm (SUNK) 支持拓扑块插件，实现跨 GB200 NVL72 机架的智能工作负载分配。此外，CoreWeave 的可观察性平台提供 NVLink 性能、GPU 利用率和温度的实时洞察。

CoreWeave 的 GB200 NVL72 实例配备 NVIDIA Quantum-2 InfiniBand 网络，为最多 110,000 个 GPU 的集群提供每 GPU 400Gb/s 的带宽。NVIDIA BlueField-3 DPU 还为这些实例提供加速的多租户云网络、高性能数据访问和 GPU 计算弹性。

面向企业 AI 的全栈加速计算平台

NVIDIA 的全栈 AI 平台将尖端软件与基于 Blackwell 的基础设施相结合，帮助企业构建快速、准确且可扩展的 AI 智能代理。

NVIDIA Blueprints 提供预定义、可定制、即可部署的参考工作流，帮助开发人员创建实际应用。NVIDIA NIM 是一组易于使用的微服务，用于安全、可靠地部署高性能 AI 推理模型。NVIDIA NeMo 包含用于训练、定制和持续改进现代企业用例 AI 模型的工具。企业可以使用 NVIDIA Blueprints、NIM 和 NeMo 为其专用 AI 智能代理构建和微调模型。

这些软件组件都是 NVIDIA AI Enterprise 软件平台的一部分，是大规模部署智能代理 AI 的关键推动力，可以在 CoreWeave 上轻松部署。

将下一代 AI 引入云端

NVIDIA GB200 NVL72 实例在 CoreWeave 上的全面可用，标志着两家公司在将最新加速计算解决方案引入云端方面合作的最新进展。随着这些实例的推出，企业现在可以获得支持下一波 AI 推理模型和智能代理所需的规模和性能。

客户现在可以通过 CoreWeave Kubernetes Service 在 US-WEST-01 区域使用 gb200-4x 实例 ID 开始配置 GB200 NVL72 实例。

来源：至顶网人工智能频道

0赞

好文章，需要你的鼓励

NVIDIA Blackwell 现已在云端全面可用

来源：至顶网人工智能频道

2025

02/10

17:24

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: