在人工智能的推动下,AI工厂正迅速成为将计算、互连和软件打包成生产系统的蓝图,这些系统在数据中心、PC和边缘设备上大规模输出智能。曾经看起来像零件清单的东西,正在融合成针对利用率、吞吐量和"每瓦特Token数"优化的紧密集成管道。
真正的转变在于:硬件-软件堆栈正围绕融合的CPU-GPU设计、高带宽结构和可移植性层进行重建,这些层既重视开发者速度,也重视原始性能。这重新平衡了合作伙伴格局,并提出了关于资本密集度、功耗预算和新兴标准的新问题。英伟达通过英特尔进军x86领域,以及CUDA不断扩大的影响力,在超大规模云服务商、新兴云服务商和企业买家中产生了连锁反应。
在theCUBE Pod最新一期节目中,theCUBE Research的执行分析师John Furrier和首席分析师Dave Vellante以建设者的眼光分析了本周最大的动向。他们深入分析了英伟达与英特尔的投资合作,讨论CUDA的护城河是否在扩大,推演对AMD和Arm的影响,并将这些点连接到企业实际如何建立AI工厂。
"我认为这对英伟达来说是一个巨大的胜利,"Furrier说。"护城河变得更加巨大,因为我们关于护城河的整个观点是CUDA和他们拥有的双边市场。在我看来,这减轻了CUDA的压力,因为现在他们可以继续强化CUDA的竞争优势。"
AI工厂正在推动英伟达-英特尔的重新结盟。两家公司的新联盟围绕紧密耦合的CPU、GPU、结构和软件重新构建数据中心主板。除了组件之外,这一举措还涉及分发和开发者吸引力,将CUDA更深入地拉入企业堆栈,甚至大规模进入PC类别。这种组合将英伟达的触角延伸到x86仍然根深蒂固的市场,同时让英特尔与AI开发者建立关联,并成为混合架构的桥梁。
"我对此有一些想法,"Vellante补充道。"我真的认为这是一个三赢局面,绝对对英伟达有利。他们在谈论芯片市场,整体市场比这更大,但他们的整个重点是获得最好的CPU、最好的GPU集成。"
这一举措还重新排列了奖牌榜:英伟达巩固了金牌地位,英特尔凭借CUDA访问权限和联合SKU竞争银牌,AMD必须完善其GPU软件故事,Vellante表示。这种动态很重要,因为超大规模云服务商既想要选择,也想要大规模的流片时间和软件兼容性。
本周的事件展现了发展势头。IBM在纽约证券交易所敲响了收盘钟,突出了可持续发展领导地位的长远愿景,这是一个及时的故事线,气候周将联合国规模的观众带到曼哈顿。同时,Furrier和Vellante预览了theCUBE和NYSE Wired的"AI工厂"系列,标志着对新数据中心蓝图的更深入探索,从NVLink结构到液体冷却和机架级标准。
如果CUDA的领先地位得到扩展,挑战者将需要可信的开放替代方案和不牺牲每瓦特性能的工作负载可移植性。这在细分市场中是可能的,成本压力可能催化开放堆栈,但近期的重心倾向于CUDA兼容的生产路径。对于企业而言,他们将推动适合其功耗、数据和治理约束的"AI工厂"规模——关键是,他们将需要集成的"数据工厂"来使模型输出可靠和可审计。
围绕xAI、特斯拉等公司的资金、估值和机器人技术线索凸显了资本如何追逐物理-数字融合。然而,近期的赢家将是那些能够将计算、互连、软件和数据管道打包成可重复蓝图的供应商,客户可以放心地部署这些蓝图——从超大规模到企业规模。
"我认为市场仍然需要理解这一点,"Furrier说。"这就是为什么我现在喜欢这个市场,因为即使这个市场的增长速度没有那么快,当然对某些公司来说,价值提取将在AI方面。这一切都在推动AI。我认为企业不仅会复苏,更棒的是我们最喜欢的领域——数据中心、云、存储网络和计算仍然是最热门的。"
Q&A
Q1:什么是AI工厂?它有什么作用?
A:AI工厂是将计算、互连和软件打包成生产系统的新蓝图,这些系统在数据中心、PC和边缘设备上大规模输出智能。它们围绕融合的CPU-GPU设计、高带宽结构和可移植性层进行构建,针对利用率、吞吐量和"每瓦特Token数"进行优化。
Q2:英伟达与英特尔的合作对CUDA有什么影响?
A:这次合作扩大了CUDA的护城河,减轻了CUDA面临的竞争压力。通过与英特尔合作,英伟达能够将CUDA更深入地推入企业堆栈和PC市场,同时进入x86仍然占主导地位的市场,进一步巩固CUDA作为行业标准的地位。
Q3:这种合作对AMD等竞争对手意味着什么?
A:AMD面临更大的挑战,必须完善其GPU软件故事。如果AMD无法获得CUDA指令集的访问权限,他们需要依靠自己构建的软件和开源软件。这次英伟达-英特尔合作降低了CUDA被颠覆的可能性,进一步巩固了其标准地位。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
中科院深圳先进技术研究院联合中科院大学提出PACS框架,通过将强化学习问题转换为监督学习任务,让大语言模型学会自我监督和评价。该方法在数学推理任务上显著超越现有方法,在AIME 2025测试中成功率达59.78%,比传统方法提升13-14个百分点,为AI推理能力提升开辟了新路径。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
Orange Research团队开发的DivMerge技术实现了AI模型合并的重大突破,通过基于信息论的Jensen-Shannon散度优化,能够将多个专门模型智能组合成保持各自专长的"超级模型"。该技术在双任务合并中达到99.18%性能保持率,显著优于传统88.48%的水平,且在多任务场景下展现更好扩展性,仅需25个样本即可有效工作,为AI应用降本增效提供了新路径。