据《华尔街日报》周五晚间报道,英伟达公司正在开发一款专用推理处理器,该处理器将被OpenAI等人工智能公司用于开发更快速、更高效的模型。
这款新的推理平台预计将在本月晚些时候于圣何塞举行的英伟达年度GTC开发者大会上发布,并将整合该公司去年12月从芯片初创公司Groq收购的技术。
推理是指在生产环境中运行已训练AI模型的过程,已成为AI行业的关键关注领域。英伟达的竞争对手如谷歌和亚马逊云服务都开发了专门的推理芯片来与其图形处理器竞争,同时还面临来自Cerebras Systems和SambaNova Systems等专业推理芯片初创公司的竞争。
据报道,OpenAI已获得英伟达新推理芯片的早期使用权,并将成为最早的采用者之一,这对这家芯片制造商来说是一个重大胜利。尽管OpenAI一直在寻找比英伟达GPU更高效的替代方案以实现计算堆栈的多样化,但上周它从这家全球顶级芯片制造商获得了300亿美元的资金支持,重申了对该公司的承诺。
英伟达是全球最主要的GPU制造商,GPU是能够同时执行数十亿项任务的专用处理器。但尽管该公司继续坚持认为GPU在训练和推理方面都很有用,其GPU在为AI应用提供动力方面已不再被认为是最高效的选择。许多公司发现英伟达的芯片耗能过高,使得它们在智能体等应用中成本极其昂贵,这些智能体需要代表人类用户自主执行任务并需要巨大的计算能力。
这就是为什么OpenAI上个月与Cerebras签署了价值数十亿美元的合同,以获得其餐盘大小的推理专用芯片。Cerebras声称其芯片在推理任务方面比英伟达的GPU快得多。
据报道,英伟达的推理芯片将整合Groq开发的技术。英伟达在去年12月以200亿美元的价格非独家许可了Groq的技术,作为交易的一部分,还聘请了其创始首席执行官Jonathan Ross和总裁Sunny Madra。这被称为硅谷历史上最大的"收购招聘"之一。
Groq的推理芯片被称为"语言处理单元",它们基于全新的架构,能够以更低的能耗执行推理。然而,英伟达尚未透露如何计划使用这家初创公司的技术。
据报道,OpenAI希望使用英伟达的新推理芯片来为其Codex编程工具提供动力,该工具是Anthropic公司Claude Code的竞争对手。编程应用已成为生成式AI最强大和最有利可图的用例之一,这是OpenAI仅次于市场领导者Claude Code的领域。
英伟达还在推广其中央处理器作为运行推理工作负载的另一种选择。传统上,大多数公司将其GPU与CPU配对使用,利用两种芯片协同工作来补偿彼此的低效率。
但英伟达表示,一些智能体AI工作负载实际上可以在其最先进的Grace CPU上单独运行得更高效。上个月,Meta平台公司成为首家承诺进行首次大规模纯CPU部署的公司,以支持其广告定向智能体在生产环境中的运行。
Q&A
Q1:英伟达为什么要开发专门的推理芯片?
A:因为虽然英伟达的GPU在AI训练方面表现出色,但在推理任务中已不再是最高效的选择。许多公司发现英伟达的芯片耗能过高,在智能体等需要巨大计算能力的应用中成本极其昂贵,因此市场需要更节能的推理专用处理器。
Q2:英伟达的新推理芯片会整合哪些技术?
A:新推理芯片将整合英伟达去年12月从芯片初创公司Groq收购的技术。Groq的推理芯片被称为"语言处理单元",基于全新架构,能够以更低的能耗执行推理任务,比传统GPU更加高效节能。
Q3:OpenAI会如何使用英伟达的新推理芯片?
A:据报道,OpenAI已获得英伟达新推理芯片的早期使用权,计划用它来为Codex编程工具提供动力。Codex是OpenAI开发的编程助手工具,与Anthropic公司的Claude Code竞争,编程应用已成为生成式AI最有利可图的用例之一。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。