OpenAI与Broadcom联合发布专为大语言模型推理设计的芯片

OpenAI与博通宣布推出名为"Jalapeno"的定制ASIC芯片,专为数据中心大语言模型推理设计。该芯片历时九个月研发,基于OpenAI研究人员的深度反馈及其未来模型路线图打造。OpenAI表示,早期测试显示其每瓦性能显著优于现有最先进方案,详细技术报告将于数月内发布。两家公司计划于今年底前在数据中心部署该芯片,此举也是OpenAI减少对英伟达依赖、实现全栈自研战略的重要一步。

OpenAI与老牌芯片供应商Broadcom近日宣布推出一款名为Jalapeno的全新芯片,专为数据中心场景下的大语言模型推理任务而设计。

两家公司表示,该芯片将被部署于大型数据中心,并将其定位为一项长期合作项目的首代产品,未来还将持续迭代优化。

Broadcom介绍,这款专用集成电路(ASIC)完全从零开始设计,其研发过程充分融入了来自OpenAI研究人员的深度洞察,并参考了OpenAI针对未来模型与产品的技术路线图。整个设计与生产周期历时九个月。

相比现有数据中心推理系统所采用的通用芯片,Jalapeno专为当前大语言模型的实际需求量身打造,针对性更强。

OpenAI表示,"早期测试结果显示,Jalapeno在每瓦性能表现上将显著优于目前业界最先进水平",但同时指出性能评估工作尚未完成,"详细的技术报告将于未来数月内正式发布"。因此,目前外界所能获取的技术细节仍然有限。

OpenAI此举背后有着更宏观的战略考量。作为ChatGPT和Codex等产品的背后推手,该公司致力于掌控其模型与产品所依赖的完整技术栈,从而降低对英伟达等外部供应商的依赖,并通过垂直整合在性能或效率上获得潜在优势。

从行业大背景来看,OpenAI及其竞争对手普遍对定制芯片抱有浓厚兴趣。在全球算力资源紧张、各方争相抢占有限数据中心容量的背景下,定制芯片是提升整体算力供给的重要路径之一。

Broadcom本已是一家成熟的芯片制造商,在算力基础设施领域积累深厚。近年来,随着AI浪潮兴起,其为超大规模云服务商及前沿模型研发团队提供定制芯片的业务板块持续扩张,发展势头强劲。

两家公司均表示,Jalapeno芯片将于今年年底前完成数据中心部署。

Q&A

Q1:Jalapeno芯片和普通GPU有什么区别?

A:Jalapeno是一款专用集成电路(ASIC),专门针对大语言模型推理任务设计,而非像GPU那样面向通用计算场景。OpenAI早期测试显示,Jalapeno在每瓦性能表现上将显著优于当前业界最先进水平。由于它的设计完全基于OpenAI对未来模型的技术路线图,理论上能够更高效地满足大语言模型推理的实际需求,而非依赖通用芯片来"凑合"完成任务。

Q2:OpenAI为什么要和Broadcom合作自研芯片,而不是继续用英伟达的产品?

A:OpenAI的目标是掌控其模型与产品背后的完整技术栈,减少对英伟达等外部供应商的依赖。通过垂直整合,OpenAI希望在性能或能效上获得额外优势。此外,当前全球算力资源较为紧张,各大AI公司都在争抢有限的数据中心容量,自研定制芯片也是缓解算力压力、提升整体供给能力的重要手段。

Q3:Jalapeno芯片什么时候可以投入使用?

A:根据OpenAI和Broadcom双方的表态,Jalapeno芯片计划于2025年底前完成数据中心部署。不过,由于性能评估工作尚未完成,详细的技术报告预计将在未来数月内发布,届时外界才能获得更完整的技术参数与测试数据。

来源:Arstechnica

0赞

好文章,需要你的鼓励

2026

06/25

10:59

分享

点赞

邮件订阅