英伟达Rubin GPU或将延期，下一阶段AI基础设施建设受阻

英伟达新一代AI芯片Rubin GPU预计今年下半年出货，但因供应链压力与技术挑战，面临延期风险。据TrendForce数据，Rubin GPU在2026年整体出货占比预期从29%下调至22%。主要挑战包括HBM4验证、网络互联升级及液冷方案优化等。分析师指出，延期将迫使企业延长Blackwell架构使用周期，推高云端AI资源价格，并可能加速企业向AMD及定制芯片多元化布局。Blackwell平台预计在2026年仍占出货量逾70%。

英伟达最新一代AI芯片Rubin GPU原计划于今年晚些时候出货，但受持续的地缘政治压力和供应链限制影响，可能面临供货延迟。

据TrendForce研究机构预测，Rubin GPU在英伟达整体出货量中的占比，已从此前预期的29%下调至2026年约22%的较低水平。该机构指出，导致延迟的主要挑战包括：HBM4验证问题、网络互连从CX8向CX9的切换、更高功耗的管理，以及在更先进液冷方案下的性能优化。

此次延迟可能对下一波AI基础设施升级浪潮产生深远影响。英伟达方面暂未回应置评请求。

现有平台的应对与局限

英伟达现有的Blackwell和Hopper架构目前仍能满足模型训练与推理的计算需求。然而，Rubin并非一次常规的GPU升级，其设计目标是通过提升计算密度、内存带宽和整体效率，从根本上改善大规模AI的经济性。

Greyhound Research首席分析师Sanchit Vir Gogia表示："Rubin旨在降低每Token的成本，减少大型工作负载所需的GPU数量，并使大规模推理在经济上具备可持续性。这一点尤为重要，特别是在AI向智能体工作负载演进、计算需求成倍增长的背景下。"

Rubin平台原本预计率先被超大规模云服务商和AI原生企业采用，这些机构具备支撑高密度系统、先进散热及高度集成架构的基础设施能力。

超大规模云服务商的缓冲策略

通常情况下，超大规模云服务商会率先采购先进GPU，在内部部署并通过云平台对外提供，企业客户则在此后6至12个月内通过API和云服务逐步获得访问权限。

TechInsights半导体分析师Manish Rawat表示："超大规模云服务商将通过延长Blackwell的使用周期、优先部署高ROI工作负载来消化初期冲击，同时压缩对外开放的算力资源。这将收紧云端算力的可用性，加剧定价波动，并进一步凸显预留算力资源的重要性。"

他补充称，企业用户可能面临二阶影响，包括云端AI基础设施访问受限，以及下一代实例上线时间延迟。

对企业AI部署的影响

Rubin的推迟上市不太可能叫停企业的AI建设进程，但会影响部署时间表和成本预期。

Gogia指出，许多企业的AI战略在一定程度上都隐性依赖于未来硬件来弥补当下的效率短板，例如更高的性价比、更强的计算密度和更好的能效表现。

"这不会导致AI活动停滞，但会带来更分阶段的部署节奏、更多的混合消费模式，以及更严格的财务审查。企业将优先考虑以推理为主导的部署方案、规模较小的计算集群，以及允许弹性扩展的混合架构，以避免过早锁定某一特定硬件路线。"Gogia说道。

Rawat则指出，这一局面可能加速企业向AMD及定制芯片等替代方案的分散化布局，同时推动业界更加关注CUDA之外的软件可移植性。

对大规模AI基础设施的深层影响

此次延迟的影响将在私有AI集群和AI工厂等大型部署场景中更为显著。

Rawat表示："Rubin代表着向系统级AI基础设施的转变，专为具备高效成本和高吞吐量的全天候AI工厂而优化。一旦延迟，企业将继续在英伟达Blackwell和Hopper平台上推进部署，虽然技术方向得以延续，但经济性将有所下降，具体表现为利用率偏低、能耗成本上升以及硬件投入加大。"

TrendForce预计，在Rubin缺席的情况下，企业将持续依赖以Blackwell为代表的现有平台，预计该平台2026年的出货占比将超过70%，主要由GB300或B300系列产品主导。

Rawat表示，部署周期可能拉长数个季度，形成临时性的需求递延，而非真实需求的消失。由于AI采用仍以实际工作负载为驱动，短期内或存在一定摩擦，但一旦Rubin平台大规模落地，需求有望迎来集中爆发。

Q&A

Q1：英伟达Rubin GPU为什么会出现延迟？

A：根据TrendForce的分析，Rubin GPU的延迟主要源于多项技术与供应链挑战，包括HBM4内存的验证问题、网络互连从CX8升级至CX9的过渡难度、更高功耗的管理需求，以及在先进液冷方案下的性能优化问题。此外，持续的地缘政治压力和供应链限制也是重要外部因素。受此影响，Rubin在2026年出货量中的占比预计从29%下调至22%。

Q2：Rubin GPU延迟对企业AI部署有什么影响？

A：Rubin GPU延迟不会叫停企业的AI建设，但会影响部署节奏和成本预期。企业将更倾向于以推理为主导的部署、小型计算集群和混合架构，以避免过早绑定特定硬件。同时，云端AI算力可用性收紧、定价波动加剧，企业获取下一代云实例的时间也将相应推迟。此外，部分企业可能加速转向AMD及定制芯片等替代方案。

Q3：Rubin GPU延迟后，英伟达Blackwell平台的市场地位会如何变化？

A：在Rubin缺席的情况下，英伟达Blackwell平台的市场地位将进一步巩固。TrendForce预计，2026年Blackwell平台的出货占比将超过70%，主要由GB300或B300系列产品主导。超大规模云服务商也将通过延长Blackwell使用周期来应对Rubin的供货延迟，企业用户同样将继续依赖Blackwell和Hopper架构推进现有AI部署。

来源：Networkworld

0赞

好文章，需要你的鼓励

英伟达Rubin GPU或将延期，下一阶段AI基础设施建设受阻

来源：Networkworld

2026

04/10

09:46

分享

点赞

亚马逊Mechanical Turk停止接受新用户，众包平台走向终结

微软推出Memora，致力于解决AI智能体的记忆难题

SGE计划在英国部署14座BWRX-300小型模块堆，总装机容量达4.2吉瓦

特斯拉在迈阿密划定Robotaxi小范围服务区，得克萨斯扩张仍受阻

Luxonis完成1400万美元融资，为智能自动化打造视觉感知层

.NET 8 与 .NET 9 即将停止支持，微软建议升级至 .NET 10

苹果供应商塔塔电子遭黑客攻击，iPhone 18 Pro核心机密外泄

美国解除对Anthropic旗下Fable 5和Mythos 5大语言模型的出口限制

Meta推出定制CXL芯片Vistara，让旧内存在新服务器中焕发新生

Bending Spoons完成180亿美元IPO，创始人谈如何将运气从成功方程式中剔除

浏览器大战进入新阶段：Chrome与Safari之外的最佳替代选择

华盛顿特区都会区迎来首批途中电动公交充电桩

训练中压缩模型：CompreSSM让AI边学边"瘦身"

美国科技行业3月裁员1.5万人，增长势头受挫

新研究警告：AI关闭控制机制可能无法按预期运行

前特斯拉工程师创立的矿业初创公司携手Pronto，推进铜矿自动化运营

Meta发布由超级智能实验室打造的全新AI模型

微软开发者部门负责人Julia Liuson宣布离职

英国政府顶级科技职位薪资超越首相年薪

AI基础设施融资困局：过桥贷款能否解决资本瓶颈？

Meta超级智能实验室发布首个公开模型Muse Spark

AWS首席执行官解释为何同时投资Anthropic与OpenAI并不存在利益冲突

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: