英伟达研发神秘AI推理芯片，下月或正式发布

据《华尔街日报》报道，英伟达正在开发一款专用推理处理器，供OpenAI等人工智能公司使用以开发更快更高效的模型。该推理平台预计在本月晚些时候的GTC开发者大会上发布，将整合去年12月从芯片初创公司Groq收购的技术。OpenAI已提前获得该芯片的使用权并将成为首批采用者。英伟达以200亿美元许可了Groq的技术，该技术被称为"语言处理单元"，基于全新架构实现更低能耗的推理处理。

据《华尔街日报》周五晚间报道，英伟达公司正在开发一款专用推理处理器，该处理器将被OpenAI等人工智能公司用于开发更快速、更高效的模型。

这款新的推理平台预计将在本月晚些时候于圣何塞举行的英伟达年度GTC开发者大会上发布，并将整合该公司去年12月从芯片初创公司Groq收购的技术。

推理是指在生产环境中运行已训练AI模型的过程，已成为AI行业的关键关注领域。英伟达的竞争对手如谷歌和亚马逊云服务都开发了专门的推理芯片来与其图形处理器竞争，同时还面临来自Cerebras Systems和SambaNova Systems等专业推理芯片初创公司的竞争。

据报道，OpenAI已获得英伟达新推理芯片的早期使用权，并将成为最早的采用者之一，这对这家芯片制造商来说是一个重大胜利。尽管OpenAI一直在寻找比英伟达GPU更高效的替代方案以实现计算堆栈的多样化，但上周它从这家全球顶级芯片制造商获得了300亿美元的资金支持，重申了对该公司的承诺。

英伟达是全球最主要的GPU制造商，GPU是能够同时执行数十亿项任务的专用处理器。但尽管该公司继续坚持认为GPU在训练和推理方面都很有用，其GPU在为AI应用提供动力方面已不再被认为是最高效的选择。许多公司发现英伟达的芯片耗能过高，使得它们在智能体等应用中成本极其昂贵，这些智能体需要代表人类用户自主执行任务并需要巨大的计算能力。

这就是为什么OpenAI上个月与Cerebras签署了价值数十亿美元的合同，以获得其餐盘大小的推理专用芯片。Cerebras声称其芯片在推理任务方面比英伟达的GPU快得多。

据报道，英伟达的推理芯片将整合Groq开发的技术。英伟达在去年12月以200亿美元的价格非独家许可了Groq的技术，作为交易的一部分，还聘请了其创始首席执行官Jonathan Ross和总裁Sunny Madra。这被称为硅谷历史上最大的"收购招聘"之一。

Groq的推理芯片被称为"语言处理单元"，它们基于全新的架构，能够以更低的能耗执行推理。然而，英伟达尚未透露如何计划使用这家初创公司的技术。

据报道，OpenAI希望使用英伟达的新推理芯片来为其Codex编程工具提供动力，该工具是Anthropic公司Claude Code的竞争对手。编程应用已成为生成式AI最强大和最有利可图的用例之一，这是OpenAI仅次于市场领导者Claude Code的领域。

英伟达还在推广其中央处理器作为运行推理工作负载的另一种选择。传统上，大多数公司将其GPU与CPU配对使用，利用两种芯片协同工作来补偿彼此的低效率。

但英伟达表示，一些智能体AI工作负载实际上可以在其最先进的Grace CPU上单独运行得更高效。上个月，Meta平台公司成为首家承诺进行首次大规模纯CPU部署的公司，以支持其广告定向智能体在生产环境中的运行。

Q&A

Q1：英伟达为什么要开发专门的推理芯片？

A：因为虽然英伟达的GPU在AI训练方面表现出色，但在推理任务中已不再是最高效的选择。许多公司发现英伟达的芯片耗能过高，在智能体等需要巨大计算能力的应用中成本极其昂贵，因此市场需要更节能的推理专用处理器。

Q2：英伟达的新推理芯片会整合哪些技术？

A：新推理芯片将整合英伟达去年12月从芯片初创公司Groq收购的技术。Groq的推理芯片被称为"语言处理单元"，基于全新架构，能够以更低的能耗执行推理任务，比传统GPU更加高效节能。

Q3：OpenAI会如何使用英伟达的新推理芯片？

A：据报道，OpenAI已获得英伟达新推理芯片的早期使用权，计划用它来为Codex编程工具提供动力。Codex是OpenAI开发的编程助手工具，与Anthropic公司的Claude Code竞争，编程应用已成为生成式AI最有利可图的用例之一。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

英伟达研发神秘AI推理芯片，下月或正式发布

来源：SiliconANGLE

2026

03/02

16:02

分享

点赞

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Apple芯片现不可修复漏洞，或成iPhone越狱突破口

ChatGPT周活跃用户突破9亿大关，订阅用户达5000万

Anthropic陷入自设陷阱：安全承诺与现实冲突

容器化智能体平台NanoClaw：更安全的OpenClaw替代方案

联想MWC 2026展示模块化双屏ThinkBook概念机

AI音乐生成器Suno付费用户突破200万，年收入达3亿美元

大语言模型总是说"是"会给世界带来什么后果？

澳大利亚数据中心扩张将如何影响电力价格与资源供应

投资者揭露AI SaaS公司投资新趋势

橡树岭实验室成立研究所应对AI数据中心电力需求激增

数据中心开发商面临披露温室气体排放影响的压力

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: