OpenAI与老牌芯片供应商Broadcom近日宣布推出一款名为Jalapeno的全新芯片,专为数据中心场景下的大语言模型推理任务而设计。
两家公司表示,该芯片将被部署于大型数据中心,并将其定位为一项长期合作项目的首代产品,未来还将持续迭代优化。
Broadcom介绍,这款专用集成电路(ASIC)完全从零开始设计,其研发过程充分融入了来自OpenAI研究人员的深度洞察,并参考了OpenAI针对未来模型与产品的技术路线图。整个设计与生产周期历时九个月。
相比现有数据中心推理系统所采用的通用芯片,Jalapeno专为当前大语言模型的实际需求量身打造,针对性更强。
OpenAI表示,"早期测试结果显示,Jalapeno在每瓦性能表现上将显著优于目前业界最先进水平",但同时指出性能评估工作尚未完成,"详细的技术报告将于未来数月内正式发布"。因此,目前外界所能获取的技术细节仍然有限。
OpenAI此举背后有着更宏观的战略考量。作为ChatGPT和Codex等产品的背后推手,该公司致力于掌控其模型与产品所依赖的完整技术栈,从而降低对英伟达等外部供应商的依赖,并通过垂直整合在性能或效率上获得潜在优势。
从行业大背景来看,OpenAI及其竞争对手普遍对定制芯片抱有浓厚兴趣。在全球算力资源紧张、各方争相抢占有限数据中心容量的背景下,定制芯片是提升整体算力供给的重要路径之一。
Broadcom本已是一家成熟的芯片制造商,在算力基础设施领域积累深厚。近年来,随着AI浪潮兴起,其为超大规模云服务商及前沿模型研发团队提供定制芯片的业务板块持续扩张,发展势头强劲。
两家公司均表示,Jalapeno芯片将于今年年底前完成数据中心部署。
Q&A
Q1:Jalapeno芯片和普通GPU有什么区别?
A:Jalapeno是一款专用集成电路(ASIC),专门针对大语言模型推理任务设计,而非像GPU那样面向通用计算场景。OpenAI早期测试显示,Jalapeno在每瓦性能表现上将显著优于当前业界最先进水平。由于它的设计完全基于OpenAI对未来模型的技术路线图,理论上能够更高效地满足大语言模型推理的实际需求,而非依赖通用芯片来"凑合"完成任务。
Q2:OpenAI为什么要和Broadcom合作自研芯片,而不是继续用英伟达的产品?
A:OpenAI的目标是掌控其模型与产品背后的完整技术栈,减少对英伟达等外部供应商的依赖。通过垂直整合,OpenAI希望在性能或能效上获得额外优势。此外,当前全球算力资源较为紧张,各大AI公司都在争抢有限的数据中心容量,自研定制芯片也是缓解算力压力、提升整体供给能力的重要手段。
Q3:Jalapeno芯片什么时候可以投入使用?
A:根据OpenAI和Broadcom双方的表态,Jalapeno芯片计划于2025年底前完成数据中心部署。不过,由于性能评估工作尚未完成,详细的技术报告预计将在未来数月内发布,届时外界才能获得更完整的技术参数与测试数据。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
Salesforce正式推出Help Agent,这是基于Agentforce平台的预封装AI客服智能体,可在数分钟内连接企业知识库、操作功能及网页、短信、语音等沟通渠道。该产品同步推出按解决率计费模式,每次成功自主解决客户问题收费2美元,无需按token或操作次数计费。Help Agent支持低代码构建,内置测试功能,并配备全新客户服务门户。该产品预计于2026年7月正式上线。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。