人工智能基础设施领域的竞争格局正在发生深刻转变,焦点正从抢购英伟达GPU转向争夺电力资源。本周CoreWeave与Nebius公布的财报,清晰展现了新型云服务(Neocloud)市场如何从一个小众的GPU云细分领域,迅速演变为围绕电力、网络、冷却和部署规模构建的资本密集型基础设施层。
两家公司在为超大规模云厂商、模型开发者和企业推理工作负载扩展AI云平台的同时,营收实现爆炸式增长,基础设施支出也同步飙升。
新型云服务公司最初主要被视为专门的GPU云服务商,旨在抓住生成式AI早期的需求红利。如今,它们正越来越多地将自身定位为与超大规模云厂商并驾齐驱的长期AI基础设施运营商。
这种演变反映出AI经济模式的变化:企业正从实验性训练负载转向持续性推理部署,后者要求长期稳定的利用率、高密度GPU集群和工业级基础设施协调能力。
这一转变迫使运营商不再仅靠GPU供应能力竞争,而是更多地比拼执行力——锁定电力容量、构建高速网络架构、部署先进冷却系统,并以足够快的速度让基础设施上线,以满足超大规模厂商和企业的需求。
CoreWeave加速扩张
作为GPU即服务(GPUaaS)提供商,CoreWeave公布第一季度营收20.8亿美元,同比增长112%,营收订单储备从去年同期的259亿美元跃升至994亿美元。调整后EBITDA达到11.6亿美元,利润率56%,但净亏损从去年同期的3.15亿美元扩大至7.4亿美元。
公司当季活跃电力容量突破1吉瓦,合同电力容量增加超过400兆瓦,总量超过3.5吉瓦。资本支出达到68亿美元,公司继续以工业规模建设AI基础设施。
CoreWeave将2026年资本支出预测区间下限上调至最高350亿美元,原因是AI需求推动基础设施组件持续涨价。
首席执行官Michael Intrator将这轮支出激增定位为长期基础设施建设的一部分,而非短期市场周期。他对路透社表示:"我所做的,是在打造一家公司。"
公司还披露与Meta达成一项新的210亿美元合作协议,用于长期AI部署。
Nebius规模跃升
Nebius的增长更为陡峭,尽管基数较小。第一季度营收同比增长684%至3.99亿美元,其中Nebius AI业务营收暴增841%至3.9亿美元。
调整后EBITDA从去年同期亏损5370万美元转为盈利1.295亿美元。
公司将年度资本支出指引从此前的160亿至200亿美元,上调至200亿至250亿美元。第一季度资本支出达到25亿美元,去年同期仅为5.44亿美元。
Nebius还表示,预计到年底合同电力容量将超过4吉瓦,并宣布在宾夕法尼亚州规划一个AI园区,可支持高达1.2吉瓦的电力容量。
首席执行官Arkady Volozh向路透社透露,随着企业从AI实验阶段进入生产部署阶段,需求继续超过可用GPU供应。
分析师观点:电力成为关键挑战
这些数据折射出AI基础设施市场正在发生的更广泛转变。在生成式AI热潮的第一阶段,云服务商主要争夺英伟达GPU的获取渠道。如今,运营商越来越多地在比拼谁能更快实现AI产能的工业化。
Dell'Oro Group副总裁Sameh Boujelbene对Data Center Knowledge表示:"最强的新型云服务商开始呈现出持久基础设施层的特征,而不仅是临时的GPU套利层。关键转变在于,竞争焦点正从'谁有可用的GPU'转向'谁能最快实现AI产能工业化'——电力、土地、冷却、网络、融资和客户承诺。"
在吉瓦级规模下,运营商面临一类新的瓶颈:电网接入排队、变压器短缺、输电线路接入、变电站建设以及备用电源系统。
HyperFrame Research数据平台与韧性分析师Don Gentile表示:"我们与厂商及其下游用户的交流中听到,推理正在将AI基础设施从周期性的训练任务转变为持续性的生产任务。利用率和协调效率现在直接决定这些部署的经济性。"
Gentile指出,仅凭GPU供应已无法决定运营商的扩展速度。
他说:"我们的HyperFrame Lens研究证实,GPU可用性已不再是唯一的决定性约束。电力采购、冷却就绪状态和部署速度,现在共同决定AI基础设施转化为生产力的速度。"
成本压力蔓延至GPU之外
支出激增也表明,基础设施通胀正向AI物理堆栈的更深层扩散。
CoreWeave和Nebius在冷却系统、网络设备、配电设备和电力基础设施上投入巨资,构建为持续推理工作负载(而非间歇性训练任务)优化的高密度AI环境。
Gentile表示:"超大规模云厂商发展迅速,但新型云服务商填补了通用云环境最初没有围绕设计的即时且持久的角色。"
公用事业公司和电网规划机构已感受到压力。近几个月来,美国多家运营商警告称,大型AI数据中心项目正在给负荷预测、输电规划和长期发电模型带来压力。
与此同时,超大规模厂商继续在内部建设之外寻找AI产能。CoreWeave与Meta合作关系的扩展,反映出新型云服务商正越来越多地为追求更快部署周期的科技巨头扮演外包AI基础设施运营商的角色。
这一模式可能随着时间推移改变议价格局。长期超大规模合作提供了融资杠杆和稳定需求,但也可能使新型云运营商依赖于数量相对较少的巨型租户。
执行力主导竞争
Boujelbene表示,随着AI集群扩展至数万块GPU,网络架构正成为核心竞争差异化要素。
他说:"在AI规模下,买方购买的不只是GPU,而是集群级性能——数万块GPU能够多高效地像一个整体系统协同运作。"
这一动态使那些从一开始就围绕高速互连、低延迟架构、存储编排和液冷机架密度进行设计的运营商受益。
Gentile表示,下一阶段的竞争分水岭可能不再取决于硬件采购,而更多依赖于运营协调能力。
他说:"AI基础设施竞争正从硬件采购转向执行质量。差异化要素正变成在持续规模下协调电力、网络、存储和推理工作负载的能力。"
两份财报传递的更广泛信号是,AI建设的下一阶段或许不再取决于谁能拿到GPU,而是谁能足够快地获得电力,让庞大的AI集群持续运转。
Q&A
Q1:CoreWeave第一季度财报有哪些亮点?
A:CoreWeave第一季度营收20.8亿美元,同比增长112%,营收订单储备从259亿美元跃升至994亿美元。调整后EBITDA达到11.6亿美元,利润率56%。当季活跃电力容量突破1吉瓦,合同电力容量超过3.5吉瓦,资本支出达68亿美元。公司还与Meta达成210亿美元的长期AI部署合作。
Q2:为什么电力成为AI基础设施竞争的关键?
A:随着企业从实验性AI训练转向持续性推理部署,需要稳定利用率和高密度GPU集群。在吉瓦级规模下,运营商面临电网接入排队、变压器短缺、输电线路接入等瓶颈。GPU可用性已不再是唯一约束,电力采购、冷却就绪状态和部署速度共同决定AI基础设施的生产力转化速度。
Q3:Nebius的业务增长情况如何?
A:Nebius第一季度营收同比增长684%至3.99亿美元,其中AI业务营收增长841%至3.9亿美元,调整后EBITDA从亏损5370万美元转为盈利1.295亿美元。公司将年度资本支出指引上调至200亿至250亿美元,预计年底合同电力容量超过4吉瓦,并计划在宾夕法尼亚州建设可支持1.2吉瓦电力的AI园区。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。