英伟达首席执行官黄仁勋的每次主题演讲都像一场马拉松。这是一场长达2.5小时的产品发布和合作伙伴关系展示,旨在测试最铁杆硅谷粉丝的极限。演讲节奏快、信息量大,坦率地说,需要大量时间消化。
但如果你在两小时左右的时候走神了,就会错过一个关键故事。
黄仁勋花了大约两分钟宣布英伟达智能体工具包。正如我们上周所写,它是"一套旨在增强人工智能智能体能力的开源工具"的一部分。
然而,TheCUBE研究合作伙伴Raphaelle d'Ornano认为,这个看似次要的公告值得比现在更多的关注。因此本周,她发布了最新的深度分析,探讨她认为智能体工具包揭示了英伟达更大的野心和战略。
重现CUDA战略手册
这不是一个新策略,而是英伟达的经典强势举措。2006年,其CUDA软件将图形处理单元从"游戏玩具"转变为现代AI的计算支柱。这是一个长期投注,花了10年时间才获得回报,创造了竞争对手至今仍在努力跨越的护城河。
现在,黄仁勋正在重现CUDA战略手册,但他向堆栈上层移动了一层。
智能体工具包不是要拥有"智能"(AI模型),而是要拥有每个企业智能体下的基础设施。无论你运行GPT-4、Claude还是Llama,英伟达都想成为管道。不是大脑——是基质。
分解"智能体系统"
Raphaelle将其分解为四个关键组件,它们作为统一的高性能系统运行:
Nemotron:这不是"前沿模型"杀手。它不试图在推理上超越Claude。这是一个精简、高效的开源模型家族,针对繁重工作进行了优化。它以一小部分成本处理80%的常规企业任务。
OpenShell:这是"房间里的成年人"。它是一个开源运行时,执行基于策略的安全和隐私护栏。这是企业在让智能体在其数据上运行之前必须具备的治理层。
AI-Q蓝图:这是连接组织。我们谈论的是比传统方法快15倍的检索管道。它具有混合路由系统,将"重型工作"发送到前沿模型,将"常规"任务发送到Nemotron,将查询成本削减50%以上。
NemoClaw:"简易按钮"。它将整个堆栈——框架、模型和安全——打包成一个单一的、可部署的企业级单元。
生态系统就是护城河
这不仅仅是产品发布,而是实时形成的生态系统。软件即服务世界正在进行控制权的"圈地运动",SaaS公司正在选择英伟达作为他们的基础。Salesforce正在此堆栈上部署Agentforce;SAP正在连接Joule;ServiceNow正在整合其Apriel模型。从Adobe到Palantir Technologies,重量级企业正在用代码投票。
编排紧张局势
D'Ornano将真正的战斗框架化为两种架构之间的对决:
架构A:Anthropic和OpenAI等模型提供商编排一切。SaaS现任者成为应用程序编程接口端点。英伟达销售GPU但在芯片之上什么都捕获不到。
架构B:SaaS现任者在英伟达基础设施上编排,使用其上下文护城河进行差异化,而英伟达捕获硬件层和其下的软件基础设施层。
智能体工具包是英伟达让架构B获胜的策略。
英伟达押注架构B,但有一个问题:编排税。在复杂的15步智能体工作流中,每步95%准确率的模型超过一半时间失败(46%成功)。在99%时,成功率跳跃到86%。
目前,只有Claude和GPT等前沿模型在高级规划方面达到这些"刚刚好"的数字。这给实验室带来了巨大的定价权力。
底线
她识别出的紧张关系在这里。英伟达自己的AI-Q设计承认,前沿编排任务仍需要Claude或GPT级别的质量。在智能体工作流中,模型质量不会优雅地降级。在15步工作流中每步达到95%准确率的模型仅46%的时间提供正确结果。在99%时,这跳跃到86%。
编排步骤是前沿实验室掌握定价权的地方。这是规划、错误恢复和多步协调发生的地方。如果这个差距不缩小,无论谁拥有运行时,模型提供商都会通过后门成为事实上的编排者。
反驳论点是前沿差距不是固定的。开源模型在不到两年时间里在许多任务上从"巨大"转变为"可忽略"。蒸馏技术正在加速这种收敛。Nemotron联盟——包括LangChain、Cursor和Mistral——专门针对智能体任务进行优化。
AI领域的"游客"可能错过了主题演讲的那两分钟,但企业参与者没有。英伟达正在悄悄巩固其作为智能体时代不可或缺基础的地位。
它不仅赢得了芯片战争,还重新定义了整个AI操作系统。
Q&A
Q1:英伟达智能体工具包是什么?它有什么作用?
A:英伟达智能体工具包是一套开源工具,旨在增强人工智能智能体的能力。它不是要拥有"智能"(AI模型),而是要拥有每个企业智能体下的基础设施,成为所有AI模型运行的底层管道。
Q2:英伟达如何重现CUDA战略?
A:英伟达正在重现2006年CUDA的成功战略,但向堆栈上层移动了一层。当年CUDA将GPU从"游戏玩具"转变为AI计算支柱,现在智能体工具包要成为智能体时代的基础设施标准。
Q3:为什么说编排步骤是关键问题?
A:在复杂的15步智能体工作流中,模型准确率直接影响成功率。95%准确率的模型只有46%成功率,99%准确率才能达到86%成功率。目前只有Claude和GPT等前沿模型能达到高级规划所需的质量标准。
好文章,需要你的鼓励
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
法国社会住房项目ViliaSprint?已正式完工,成为欧洲最大的3D打印多户住宅建筑,共12套公寓,建筑面积800平方米。项目由PERI 3D Construction使用COBOD BOD2打印机完成,整体工期较传统建造缩短3个月,实际打印仅用34天(原计划50天),现场操作人员从6人减至3人,建筑废料率从10%降至5%。建筑采用可打印混凝土,集成光伏板及热泵系统,能源自给率约达60%。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。