谷歌押注工作负载专用TPU，同步发布8t与8i两款芯片

谷歌周二发布两款第八代TPU芯片——面向训练的TPU 8t与面向推理的TPU 8i，重启分体式芯片策略。TPU 8t较前代Ironwood算力提升近3倍，双向带宽达19.2 Tbps；TPU 8i则配备288GB高带宽内存，推理延迟显著降低。分析师指出，此举有助于企业针对不同AI生命周期阶段选用最优价性比方案，避免为推理负载支付训练级成本。两款芯片将于今年晚些时候正式上线。

谷歌于本周二正式发布了两款各有侧重的第八代TPU芯片——一款专为训练设计，另一款专为推理优化，重新采用分体式芯片策略，以应对云计算厂商在AI硬件领域对性能与成本的差异化需求。

谷歌此前已有过TPU分体设计的尝试，第五代的V5p与V5e芯片便是典型案例，但此后的Trillium和Ironwood等系列基本回归了单一设计路线。

HFS Research分析师Phil Fersht认为，此次两款新芯片的分体设计，是谷歌将硬件与企业AI生命周期不同阶段更紧密对齐的战略举措，有望在生产环境中提升资源利用率和成本效益。

"训练与推理在经济模型、内存行为、网络需求和采购模式上的差异日益显著。客户越来越希望在模型生命周期的每个阶段都能获得最合适的性价比，而不是一款通用加速器打天下。"Fersht表示。

Forrester首席分析师Charlie Dai指出，从实际应用角度来看，能够在两款TPU之间自由选择，可以帮助企业避免将训练级别的高成本芯片用于推理密集型任务。

TrendForce分析师Fion Chiu也持相同观点，她认为成本更具优势的8i芯片将帮助企业以更低的价格部署大型模型。

Dai还补充道，对于OpenAI和Anthropic等模型提供商而言，这种芯片选择机制能够更清晰地区分训练集群与服务集群，同时保留通用工具和代码路径的复用能力，从而降低总体成本、提升集群效率，并简化模型生命周期的过渡流程。

HyperFRAME Research分析师Stephen Sopko指出，谷歌并非唯一走分体设计路线的芯片厂商，AWS同样拥有Trainium和Inferentia两款面向不同AI工作负载的独立芯片。

两款芯片的技术优势

尽管分体设计折射出算力经济学的变迁，但这两款芯片相较于前代Ironwood在技术层面也各有突破。

谷歌表示，专注训练的TPU 8t相较Ironwood，每个Pod的计算性能提升近3倍，支持更大规模的超级Pod，芯片间带宽也翻了一番。

具体而言，Ironwood在9216芯片Pod规模下可提供42.5艾次浮点运算，而TPU 8t在9600芯片规模下可扩展至121艾次浮点运算；双向扩展带宽提升至每芯片19.2 Tbps，是原来的两倍；跨机架扩展网络带宽也提升至400 Gbps，增长四倍。

Omdia首席分析师Alexander Harrowell表示，性能与机架间带宽的大幅提升，将支持比Ironwood更大规模模型的训练，并缩短训练时长。

相比之下，专注推理的TPU 8i在设计理念上与Ironwood有更大的转变——内存容量至少是后者的三倍。

TPU 8i配备了288GB高带宽内存与384MB片上SRAM。Harrowell指出，这使TPU的内存规模向领先GPU靠拢。他还表示，更大的片上SRAM有助于将活跃模型数据保持在更靠近处理器的位置，从而降低推理延迟，在模型规模和复杂度持续增长的背景下尤为重要。

Sopko认为，8i的架构调整反映出业界正逐步转向混合专家模型（MoE）和长上下文模型，这类模型未来还将继续扩大规模。

"万亿参数模型和百万Token上下文窗口在推理服务期间需要常驻内存，这就要求更大的内存容量和更大规模的Pod。"Sopko说道。

与Ironwood的256芯片Pod规模和每Pod 1.2艾次浮点运算相比，TPU 8i的Pod规模可扩展至1152芯片，每Pod算力达11.6艾次浮点运算。

此外，谷歌表示，两款新芯片相较Ironwood的系统效率也有所提升，每瓦性能提升2倍，并与谷歌基于Arm架构的Axion CPU主机实现了更紧密的集成。

谷歌还补充称，TPU 8t和8i将于今年晚些时候作为谷歌AI超级计算机平台的组成部分正式对外开放。

Q&A

Q1：谷歌TPU 8t和8i分别适合哪类AI任务？

A：TPU 8t专为模型训练设计，相较前代Ironwood提供近3倍计算性能和更高的芯片间带宽，适合大规模模型训练任务；TPU 8i则专为推理优化，配备288GB高带宽内存和更大片上SRAM，适合在生产环境中高效运行大型模型，两者分工明确，覆盖AI生命周期的不同阶段。

Q2：谷歌为什么要重新采用分体式TPU策略？

A：训练和推理在经济模型、内存需求、网络带宽和采购模式上差异越来越大，单一芯片难以兼顾两者的性价比。分体设计让企业可以按需选择，避免将高成本的训练级芯片用于推理任务，从而降低整体运营成本，提升资源利用率。

Q3：TPU 8i在内存方面有哪些具体提升？

A：TPU 8i搭载288GB高带宽内存和384MB片上SRAM，内存容量是Ironwood的至少三倍，整体规模已接近主流高端GPU。更大的片上SRAM可以让活跃模型数据更靠近处理器，有效降低推理延迟，对混合专家模型（MoE）和长上下文模型的服务尤为重要。

来源：Networkworld

0赞

好文章，需要你的鼓励

谷歌押注工作负载专用TPU，同步发布8t与8i两款芯片

来源：Networkworld

2026

04/23

16:25

分享

点赞

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Apple芯片现不可修复漏洞，或成iPhone越狱突破口

《火爆街头》导演预言：两年内AI演员与真人无异

英国主权AI计划首批资金落地，神经病学与生物制造初创企业获资助

Google发布Gemini智能体平台与第八代TPU

Google Workspace Intelligence：AI助力工作效率全面升级

数据中心世界2026：房地产与现场供电加速AI建设

印度医学生靠AI生成的MAGA网红月入数千美元

SpaceX与Cursor达成600亿美元潜在收购协议

YouTube深度伪造检测工具向所有名人开放，助力打击AI侵权视频

Google Cloud大力推进智能体AI与高端计算布局

谷歌地图将迎来全面AI升级，企业级地理空间功能大幅增强

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: