OpenAI与谷歌合作测试TPU芯片但暂无大规模部署计划

OpenAI澄清虽在测试谷歌TPU芯片，但暂无大规模部署计划。该公司正摆脱对微软基础设施的依赖，寻求包括甲骨文、CoreWeave等多家算力供应商合作。OpenAI一直在硬件栈多元化方面努力，从英伟达DGX系统起步，现已使用微软Maia加速器、AMD Instinct MI300系列等多种硬件。公司还在开发自研AI芯片。分析认为，OpenAI可能因软件栈主要针对GPU优化，适配TPU架构需要额外时间和资源投入。

分析显示，OpenAI不再局限于微软的基础设施，正在寻求扩展其计算提供商网络，包括甲骨文、CoreWeave，甚至竞争对手谷歌。

尽管OpenAI可能已经在谷歌建立了合作关系，但据路透社报道，这家AI公司近期内不会使用谷歌自研的张量处理单元(TPU)来运行或训练其模型。

在周末发给该媒体的声明中，OpenAI承认正在测试谷歌的TPU，但目前没有大规模部署的计划。

这一否认声明是在《The Information》报道谷歌已说服该模型构建商将工作负载转移到自研加速器几天后发出的。

OpenAI据称采用谷歌TPU技术被许多人视为一个信号，表明这家由萨姆·奥特曼支持的模型构建商不仅希望结束对微软的依赖，还希望减少对英伟达硬件的依赖。

然而，如果你一直在关注，你会知道OpenAI已经在硬件堆栈多样化方面努力了一段时间。该公司可能是从使用英伟达的DGX系统开始的，但这从来不是独家关系。

多年来，该模型构建商的GPT系列在各种硬件上运行。你可能还记得微软让GPT-3.5在其自研的Maia加速器上运行。

微软——直到最近还是OpenAI的主要基础设施提供商——也是最早采用AMD Instinct MI300系列加速器的公司之一，运行GPT-4等模型是其关键用例之一。

AMD的加速器历来提供更高的内存容量和带宽，这可能使它们在模型服务方面比英伟达的GPU更经济。

即使OpenAI与微软的关系有所缓和，AMD仍然是这家新兴AI巨头的关键硬件合作伙伴。上个月，奥特曼在圣何塞举行的AMD AI推进活动上发表演讲，强调了他们的持续合作。

更重要的是，据报道OpenAI正在开发自己的AI芯片，以进一步优化其训练和推理管道的计算、内存、带宽和网络比例。

考虑到这一切，OpenAI测试谷歌自研芯片的想法并不令人意外。搜索引擎的Gemini模型已经证明该架构完全能够进行大规模训练。

谷歌还提供这些加速器的多种不同配置，每种配置都有不同的计算、内存和可扩展性比例，这将为OpenAI提供一定的灵活性，无论他们是需要计算密集型训练作业还是内存带宽受限的推理工作负载。

谷歌第七代Ironwood TPU拥有高达4.6 petaFLOPS的密集FP8性能、192GB高带宽内存(HBM)提供7.4TB/s的带宽，以及1.2TB/s的芯片间带宽，使其与英伟达的Blackwell加速器处于同一水平。

TPUv7有两种配置：256芯片或9,216芯片的集群。据称多个集群可以连接在一起，进一步将计算能力扩展到超过40万个加速器。如果有什么能让萨姆·奥特曼兴奋的话，那就是大量的计算资源。

那么为什么OpenAI决定不使用谷歌的TPU呢？这里可能有几个因素在起作用。可能是性能没有预期的那么好，或者谷歌可能没有足够的TPU来满足OpenAI的需求，或者简单地说每个Token的成本太高。

然而，最明显的答案是OpenAI的软件堆栈在很大程度上已经优化为在GPU上运行。调整这个软件以充分利用谷歌的TPU架构需要时间和额外资源，最终可能不会比坚持使用GPU提供太多切实的好处。

正如人们所说，这山望着那山高。除非你亲自检查，否则永远不会确定知道。

来源：The Register

0赞

好文章，需要你的鼓励

OpenAI与谷歌合作测试TPU芯片但暂无大规模部署计划

来源：The Register

2025

07/03

10:31

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

Meta能否通过重金挖角实现超级智能？

阿里巴巴扩展马来西亚和菲律宾AI云服务

超越计算机视觉：实验室培养大脑及其视觉机制

Cloudian：AI推理将需要海量存储空间

智能体AI工作流自动化初创公司FileAI正式公开发布

AI机器人辩题、稳定币与AI竞赛持续发展

安全优先设计是解决AI试点工具部署停滞的关键

AI战略成功的四个关键要素

警告：一旦达到AGI和AI超级智能将无法逆转

Arm发力服务器市场但尚未撼动x86霸主地位

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: