CoreWeave借助Nvidia B300扩展AI云平台，应对推理需求激增

CoreWeave在英伟达GTC大会上发布基于Nvidia HGX B300平台的AI云服务扩展计划。新平台专注于帮助企业快速从模型训练转向生产部署，特别支持下一代智能体AI系统和强化学习工作负载。公司推出集成开发和监控功能，支持高容量推理和实时学习。B300系统提供更高AI推理性能，扩展内存容量，使团队能用更少节点运行大型模型。

CoreWeave在Nvidia GTC大会上宣布大幅扩展其AI原生云平台，旨在帮助企业更快地从模型训练转向生产部署，特别专注于下一代智能体AI系统和强化学习工作负载。

该公司宣布基于Nvidia HGX B300平台的基础设施正式发布，同时推出与机器学习实验跟踪平台Weights & Biases共同构建的一套集成开发和监控功能。

这一举措反映了更广泛的市场趋势，即各组织正从大规模训练转向持续模型改进和大规模推理。Moor Insights & Strategy副总裁兼首席分析师Matt Kimball表示："CoreWeave转向推理——激活AI——是件好事。推理是AI价值得以实现的环节，目前才刚刚起步，规模可能比训练大几个数量级。"

Kimball补充道："AI的经济影响发生在推理阶段。内存、互连带宽和效率与原始计算能力同等重要。"

HyperFrame Research常驻分析师Stephen Sopko表示，该公司的第一季度研究显示，30%的组织已达到大规模AI部署，64%预计在六个月内实现。"这正是CoreWeave正在定位捕获的需求浪潮，"Sopko说。"我们将会听到很多关于Vera Rubin的消息，但这一公告表明现在就有相应的容量。"

针对AI推理和大规模推理而构建

CoreWeave平台扩展的核心是基于Nvidia HGX B300构建的基础设施，这是使用Nvidia Blackwell架构的最新一代GPU系统的组成部分。该平台针对大规模训练、强化学习和大规模推理等快速演进的工作负载混合而设计。

据该公司介绍，基于B300的系统为AI推理和推理提供更高性能，并扩展内存容量，使团队能够用更少的节点运行大型模型。

每个部署在HGX节点中打包八个GPU，为分布式AI训练和模型服务提供密集并行计算。在节点内，Nvidia NVLink互连技术实现高带宽GPU到GPU通信和内存共享，在训练和推理过程中减少延迟。

服务器通过Nvidia Quantum-X800 InfiniBand网络跨集群连接，在节点间提供超低延迟通信。随着AI模型需要数千个GPU在分布式集群中协同工作，高速互连变得越来越重要。

CoreWeave表示，每个节点提供高达2.1TB的HBM3e内存，使开发人员能够用更少的GPU和更低的通信开销来训练和运行超过1000亿参数的模型。

为管理密集AI集群的热需求，HGX B300服务器使用液体冷却，帮助在重负载下维持峰值性能。

缩小训练与生产之间的差距

除了硬件升级，CoreWeave还展示了简化AI模型精炼和部署的新软件工作流。

来自Weights & Biases的新功能引入了两家公司称之为"无环境强化学习"的方法，使智能体能够直接从生产数据中改进，而不是仅仅依赖仿真环境。

"我喜欢CoreWeave强调让模型从真实用户学习的软件，"Kimball说。"这提高了准确性和效率。"

这种方法允许模型持续从现实世界的使用模式和性能轨迹中学习，可能加速企业AI应用的开发周期。CoreWeave表示，这些工作流可以减少训练周期并降低推理成本，同时保持模型质量。

支持自主和物理AI系统

该公司还重点介绍了针对机器人和实体AI开发的新工具。

通过更新的实验跟踪和多模态监控功能，机器人团队可以在单个工作区内比较训练输出、仿真结果和视频数据。这些工具旨在简化实验并加速物理系统的迭代。

CoreWeave还首次推出移动应用程序，用于实时监控模型训练运行，为工程师提供远程可见性和早期问题检测。

"看到对机器人的重视也很有趣，"Kimball指出。"这个市场的成熟速度比我们想象的要快。"

DCK分析：推理获得动力

该公告反映了AI基础设施的关键拐点：瓶颈不再仅仅是GPU供应，而是在生产中部署和操作AI系统的复杂性。通过将下一代硬件与集成开发和评估工作流相结合，CoreWeave正在为新兴的自主智能体和持续学习系统类别定位其平台，这些系统预计将推动企业AI采用的下一阶段。

随着AI应用投入生产，推理需求正在加速，促使云提供商构建针对持续大规模模型服务而非间歇性训练运行进行优化的基础设施。

Q&A

Q1：CoreWeave的B300平台有什么特殊优势？

A：CoreWeave基于Nvidia HGX B300的平台为AI推理提供更高性能，并扩展内存容量，每个节点提供高达2.1TB的HBM3e内存，使开发人员能够用更少的GPU运行超过1000亿参数的大型模型，同时使用液体冷却系统维持峰值性能。

Q2：什么是"无环境强化学习"方法？

A："无环境强化学习"是CoreWeave与Weights & Biases合作推出的新功能，它使智能体能够直接从生产数据中学习和改进，而不是仅仅依赖仿真环境，让模型能够持续从现实世界的使用模式中学习。

Q3：为什么说推理比训练更重要？

A：分析师指出，推理是AI价值得以实现的环节，AI的经济影响主要发生在推理阶段。推理市场规模可能比训练大几个数量级，因为随着AI应用投入生产，推理需求正在加速增长。

来源：DataCenterKnowledge

0赞

好文章，需要你的鼓励

CoreWeave借助Nvidia B300扩展AI云平台，应对推理需求激增

来源：DataCenterKnowledge

2026

03/17

13:37

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

英伟达200亿美元Groq技术加持新LPX机架系统 大幅提升AI响应速度

英伟达推出NemoClaw套件保障智能体安全应用

Nvidia DLSS 5技术将带玩家走出恐怖谷效应

CIO保罗·科比：没有IT项目，只有业务项目

ServiceNow CEO警告：AI智能体或致应届生失业率超30%

智能体驱动的安全验证：下一代网络安全防护模式

数据分析助力英格兰女足雄狮军团咆哮赛场

英伟达的NemoClaw，能帮AI代理这匹“野马”套上缰绳吗？

AI聊天机器人引发精神妄想担忧，新研究发现潜在风险

苹果公司称其即将到来的50周年庆典献礼是用户

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

英伟达200亿美元Groq技术加持新LPX机架系统大幅提升AI响应速度