OpenAI周三上午发布了一款名为Jalapeno的定制推理芯片,该芯片由OpenAI与博通联合开发,旨在为其不断扩张的AI基础设施提供动力支持。尽管Jalapeno尚未大规模部署,但博通首席执行官陈福阳表示,其性能可与英伟达备受追捧的Blackwell芯片以及谷歌的张量处理单元(TPU)相媲美。
走向定制硅芯片并非OpenAI独有的选择。谷歌、Meta和亚马逊均已推出各自的定制芯片,以期对旗下AI服务背后的基础设施取得更强的掌控权。此次发布再次印证了一个趋势:主要AI服务商正在从采购标准化现货硬件转向构建适配自身工作负载的定制化系统。
Omdia高级首席分析师亚历山大·哈罗韦尔表示:"AI应用的需求之高,已经迫使整个行业将战略转向定制化以及更高层次的集成。"
在AI领域,供应合同动辄数十亿美元,这一转变意义深远。其影响不仅体现在AI服务商的财务报表上,对于企业客户而言同样不可忽视——与其说影响来自单颗新芯片的技术参数,不如说更多来自它所揭示的AI服务经济模式与未来架构走向。
为何现在是投资定制硅芯片的时机
电子行业中,标准化商用产品与定制化专用产品之间的交替循环现象极为普遍,业界甚至为此命名——"牧本波浪"(Makimoto's Wave)。在AI处理器领域,这一波浪早已清晰可见。哈罗韦尔表示,Omdia分析师判断这一波浪自2022年起便已开始显现。
OpenAI的Jalapeno项目更是在意料之中。哈罗韦尔说:"具体来说,我们很早就知道OpenAI与博通之间存在合作项目。这不仅在业内早有传言,更是顺理成章之事——后来陈福阳在2025年第三季度财报电话会议上直接脱口而出,才让外界正式知晓。"
对这一趋势的预判,与定制硅芯片所提供的明显优势密切相关,而当前的市场环境更进一步放大了这些优势。尽管前期投入不菲,定制芯片仍能带来多方面收益。
性能大幅提升
Jalapeno是一款专用集成电路(ASIC),T-Systems International首席技术官理查德·西蒙斯表示,它本质上是一种专为AI推理需求优化的"AI加速器",用于支撑AI应用的日常运营——在OpenAI的业务场景中,这意味着每一条发送给ChatGPT的提示词都会经由它处理。
西蒙斯将这类专有硅芯片带来的下游效益概括为:"每个推理Token的成本效率更高、每瓦性能更优、延迟更低、应用与API调用响应更快,同时也能为消费者和企业客户带来持续迭代与性能提升。"
显著降低成本
对OpenAI而言,或许最值得关注的是,自研芯片将对公司利润产生重大影响。在当前许多服务商(包括OpenAI在内)与供应商签有高额合同的背景下,这一点尤为关键。
expert.ai全球AI战略与解决方案总监昆廷·勒尔表示:"每当用户向OpenAI的模型发送一次提示,公司就要承担高昂的算力成本。根据现有协议与合作关系,模型推理所产生的大部分收入直接流向了微软、OCI、AWS和英伟达等基础设施提供商。"
通过自主研发芯片并建设数据中心,OpenAI可以绕开第三方的利润抽成,从而降低运营成本,使整体商业模式更具可持续性。
哈罗韦尔进一步解释道:"英伟达的毛利率在75%至78%之间,而这些利润全部来自你自己的利润空间。如果转而采用博通这类ASIC代工商通常30%至35%的利润率,你的利润损耗就会减少一半。"
降低功耗
当前困扰AI行业的最大挑战之一是能耗问题。尽管美国政府与企业技术部门正协同推进数据中心的扩容建设,但这些项目往往需要数年才能落地,在此期间AI服务商仍将面临供给压力。定制芯片恰好可以在这一环节发挥超乎寻常的作用。
哈罗韦尔表示:"定制化有助于控制功耗,而功耗正是数据中心环境中成本的最大驱动因素。"
定制芯片在相同性能下所需功耗更低,因为它针对特定使用场景进行了深度优化。哈罗韦尔解释说,这使OpenAI能够将加速器的热设计功耗控制在700W至800W,而非突破千瓦大关,从而完全省去液冷系统,极大地改变了AI与数据中心的经济模型。
对企业客户的影响
大多数企业客户永远不会与Jalapeno芯片直接打交道。企业通过应用程序、平台和API使用AI,底层基础设施在很大程度上对用户不可见。然而,当下作出的基础设施决策,可能在未来数年内持续影响企业AI服务的成本、性能与可用性。
Omdia分析师预测,ASIC将从2027年起开始大幅抢占市场份额,考虑到价格差距较大,增长可能主要体现在出货量而非市场价值上。西蒙斯对此持乐观态度,认为这将为客户AI定价带来积极的连锁效应。
他说:"IT领导者将受益于规模经济所带来的全方位红利。推理(以及由此带来的Token)经济将受益于大规模部署下每次请求成本的下降。"
此外还有性能层面的收益。OpenAI产品内每一次优化部署,客户都将从中受益,而且由于OpenAI自身成本降低,客户所支付的费用可能与现在相差无几。
勒尔还指出了一个不那么显而易见的企业客户收益——数据安全:"通过自主研发芯片并建设专属数据中心,OpenAI现在可以降低数据在云基础设施中流转时发生泄露的风险。"
当然,值得注意的是,Jalapeno成品芯片尚未对外开放测试,目前尚无独立机构对其效能进行核实。不过哈罗韦尔指出,OpenAI采用的ASIC代工厂与服务器OEM厂商(Celestica)均与谷歌相同,这表明该芯片的性能可能相当接近。由于谷歌的TPU"在性能上确实能与Blackwell正面竞争",这为Jalapeno的前景提供了有利佐证。
话虽如此,即便与英伟达Blackwell芯片的性能对比最终并不准确,也未必切题。Jalapeno并非用于模型训练,而是专注于推理环节,因此评判标准本就不同。正如勒尔所言:"目标是开发出更契合自身架构的芯片。"
从目前来看,Jalapeno似乎已经实现了这一目标。
Q&A
Q1:OpenAI的Jalapeno芯片和英伟达Blackwell芯片有什么区别?
A:Jalapeno是专门为AI推理优化的专用集成电路(ASIC),而英伟达Blackwell则是通用GPU,兼顾训练与推理。Jalapeno的设计目标不是全面超越Blackwell,而是在推理场景下做到更高能效、更低延迟、更优成本,热设计功耗控制在700W至800W,还能省去液冷系统。由于评判标准不同,两者不宜简单对比。
Q2:OpenAI自研Jalapeno芯片能为企业客户带来哪些好处?
A:企业客户虽然不会直接接触Jalapeno芯片,但能间接受益。首先是调用成本可能下降,因为OpenAI自身推理成本降低后,有望将部分节省传导给客户;其次是响应速度和性能有望提升;此外,OpenAI通过自建芯片和数据中心,减少了数据在多个云平台间流转的环节,也在一定程度上降低了数据泄露风险。
Q3:Jalapeno芯片为什么能帮助OpenAI节省大量成本?
A:目前OpenAI每次模型推理都需要向微软、AWS、英伟达等基础设施提供商支付高额费用,英伟达GPU的毛利率高达75%至78%,这些都直接压缩了OpenAI的利润空间。自研Jalapeno芯片后,OpenAI可以绕开第三方抽成,将利润损耗从约75%压缩至博通ASIC代工的约30%至35%,大幅提升自身盈利能力和商业可持续性。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。