NVIDIA Blackwell 现已在云端全面可用

CoreWeave 推出全球首个基于 NVIDIA GB200 NVL72 的云实例，助力开启 AI 推理的新纪元。

AI 推理模型和智能代理正在改变各个行业，但要充分发挥其潜力并实现规模化，需要海量的计算能力和优化的软件支持。"推理"过程涉及多个模型，会生成大量额外的 Token，需要具备高速通信、内存和计算能力相结合的基础设施，以确保实时、高质量的结果。

为满足这一需求，CoreWeave 推出了基于 NVIDIA GB200 NVL72 的实例，成为首个将 NVIDIA Blackwell 平台推向市场的云服务提供商。

借助机架级 NVIDIA NVLink 连接的 72 个 NVIDIA Blackwell GPU 和 36 个 NVIDIA Grace CPU，以及可通过 NVIDIA Quantum-2 InfiniBand 网络扩展至 110,000 个 GPU，这些实例提供了构建和部署下一代 AI 推理模型和智能代理所需的规模和性能。

CoreWeave 上的 NVIDIA GB200 NVL72

NVIDIA GB200 NVL72 是一个液冷的机架级解决方案，具有 72 GPU NVLink 域，使这 72 个 GPU 能够作为一个巨大的 GPU 协同工作。

NVIDIA Blackwell 具有多项技术突破，可加速推理 Token 的生成，提升性能的同时降低服务成本。例如，第五代 NVLink 在单个 72 GPU NVLink 域中提供 130TB/s 的 GPU 带宽，第二代 Transformer 引擎支持 FP4，在保持高精度的同时实现更快的 AI 性能。

CoreWeave 的托管云服务组合专为 Blackwell 打造。CoreWeave Kubernetes Service 通过公开 NVLink 域 ID 优化工作负载编排，确保在同一机架内高效调度。基于 Kubernetes 的 Slurm (SUNK) 支持拓扑块插件，实现跨 GB200 NVL72 机架的智能工作负载分配。此外，CoreWeave 的可观察性平台提供 NVLink 性能、GPU 利用率和温度的实时洞察。

CoreWeave 的 GB200 NVL72 实例配备 NVIDIA Quantum-2 InfiniBand 网络，为最多 110,000 个 GPU 的集群提供每 GPU 400Gb/s 的带宽。NVIDIA BlueField-3 DPU 还为这些实例提供加速的多租户云网络、高性能数据访问和 GPU 计算弹性。

面向企业 AI 的全栈加速计算平台

NVIDIA 的全栈 AI 平台将尖端软件与基于 Blackwell 的基础设施相结合，帮助企业构建快速、准确且可扩展的 AI 智能代理。

NVIDIA Blueprints 提供预定义、可定制、即可部署的参考工作流，帮助开发人员创建实际应用。NVIDIA NIM 是一组易于使用的微服务，用于安全、可靠地部署高性能 AI 推理模型。NVIDIA NeMo 包含用于训练、定制和持续改进现代企业用例 AI 模型的工具。企业可以使用 NVIDIA Blueprints、NIM 和 NeMo 为其专用 AI 智能代理构建和微调模型。

这些软件组件都是 NVIDIA AI Enterprise 软件平台的一部分，是大规模部署智能代理 AI 的关键推动力，可以在 CoreWeave 上轻松部署。

将下一代 AI 引入云端

NVIDIA GB200 NVL72 实例在 CoreWeave 上的全面可用，标志着两家公司在将最新加速计算解决方案引入云端方面合作的最新进展。随着这些实例的推出，企业现在可以获得支持下一波 AI 推理模型和智能代理所需的规模和性能。

客户现在可以通过 CoreWeave Kubernetes Service 在 US-WEST-01 区域使用 gb200-4x 实例 ID 开始配置 GB200 NVL72 实例。

来源：至顶网人工智能频道

0赞

好文章，需要你的鼓励

NVIDIA Blackwell 现已在云端全面可用

来源：至顶网人工智能频道

2025

02/10

17:24

分享

点赞

贝索斯"普罗米修斯项目"收购AI智能体初创公司

全新Mac浏览器Orion发布：主打速度与隐私保护

Opera AI浏览器推出1分钟深度研究模式和Gemini 3 Pro集成

马斯克xAI计划在Colossus数据中心旁建设小型太阳能发电场

微软联手思科那发布零信任光网络架构框架

国内唯一，阿里千问斩获NeurIPS 2025最佳论文奖

管理嵌入式软件的开发

Dell PowerScale for Microsoft Azure构筑本地与云端的无缝存储体验

AI商务初创公司Onton获得750万美元融资，挑战零售巨头

Proximus Global与Starlink扩大欧洲直接到手机卫星连接服务

AI基础设施超前建设引发泡沫担忧，CIO如何应对

Vision Pro M5深度评测：苹果需要做出关键抉择

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: