英伟达公司不仅为下一代人工智能智能体提供基础设施,还为开发者提供构建工具。
在与Computex大会同期举行的英伟达GTC台北2026大会上,该公司发布了其Agent Toolkit的最新版本。这是一套综合性软件套件,包含开源模型和蓝图,用于构建强大的、可长时间运行的数字协作者,能够执行跨业务运营、工程和网络安全任务的复杂工作流程。
英伟达Agent Toolkit旨在成为一个开放且易于访问的基础技术栈,为开发者提供将强大的前沿模型转化为功能完整的AI智能体所需的一切。该套件包括一系列高度优化的模型和安全运行时环境,试图减少导致许多公司推迟大规模部署AI智能体的障碍。
尽管大语言模型已被证明是出色的编码助手和图形设计师,但在尝试承担更复杂的业务和运营任务时往往表现不佳。开发者面临的主要挑战之一是创建一种编排层,通常称为"线束",用于管理模型的内存以在多日会话中保持上下文,使智能体能够使用第三方工具并与其他智能体协作。
AI智能体还带来了安全隐患。当组织赋予自主智能体访问敏感文件、修改应用程序代码以及创建自己的子智能体来分担任务的自由时,这会带来传统软件企业策略无法遏制的巨大安全风险。
这些正是英伟达希望解决的挑战,为开发者提供一系列开源构建模块,使他们能够创建所需的智能体线束。借助Agent Toolkit,开发者将能够安全地大规模编排和保护数字协作者。
英伟达首席执行官黄仁勋表示,如果人们想象的AI革命要实现,AI智能体必须有办法在完成业务工作的系统中运行。
Agent Toolkit的核心是英伟达NemoClaw,这是一个新框架,作为构建智能体编排层的主要蓝图。通过NemoClaw,开发者可以访问现成的模板,这些模板构建了智能体规划、推理、执行和委派任务的方式。
黄仁勋解释说:"NemoClaw为企业软件开发者提供了开放的构建模块,以创建更安全、可长时间运行的AI协作者,在重塑工作方式的同时放大人类专业知识。"
另一个关键组件是英伟达的Nemotron 3 Ultra,这是一个专为长时间运行的自主智能体构建的大规模新型5500亿参数混合专家模型。据英伟达称,它能够在编码和研究工作流程中实现前沿级别的推理,推理速度比同类前沿模型快五倍,运行成本降低30%。
英伟达希望开发者在OpenShell安全运行时中运行这些智能体,这是一个支持自定义安全和隐私控制的安全容器环境。OpenShell运行时是与微软公司、Canonical公司和IBM公司的红帽合作开发的,与原生Windows安全原语集成,以确保AI智能体始终处于用户的完全控制之下并避免危险行为。使用该运行时,开发者可以在将查询发送到基于云的模型之前智能地屏蔽敏感数据,并确保最敏感的工作负载仅路由到本地硬件。
最后,英伟达推出了多个CUDA-X库作为可重用的"智能体技能",使智能体无需首先进行大量训练即可访问一系列专业能力。这些即插即用的技能包括cuDF,使智能体能够快速处理大规模结构化数据集并对其发现进行推理;cuOpt,赋予智能体实时解决与路由、调度、供应链、资源分配和决策优化相关的复杂问题的能力。
其他技能包括AI-Q,它将智能路由与持久上下文和内置评估集成用于企业研究工作流程;NeMo,用于加速智能体优化、评估和治理;PhysicsNeMo,供智能体进行复杂的科学和工程模拟;以及CUDA-Q,可以为智能体提供生成、测试和安装量子程序、模拟量子计算系统和编排量子应用所需的知识。
英伟达分享了一些早期采用者使用改进后的Agent Toolkit所做的工作。例如,半导体设计软件公司Cadence Design Systems使用OpenShell部署了ChipStack AI超级智能体,可以自动验证新芯片设计,英伟达是使用该智能体的第一个客户。西门子公司使用该工具包开发了Fuse EDA智能体,可以在印刷电路板设计中编排多工具工作流程。
除了工程领域,其他公司正在使用AI智能体自动化网络安全工作负载。例如,CrowdStrike Holdings基于英伟达的NemoTron 3 Ultra模型开发了多个智能体,以持续识别和修复安全漏洞。另一个客户是Palantir Technologies,该公司已将多个AI模型集成到其Forward Deployed Engineer平台中,以创建能够从先前交互中持续学习的自主、气隙系统。
英伟达表示,NemoClaw框架现已向开发者开放,而OpenShell运行时目前可作为早期预览版访问。Nemotron 3 Ultra将于6月4日推出,并将作为英伟达NIM微服务通过Hugging Face、ModelScope和OpenRouter以及英伟达自己的Build平台提供。CUDA-X智能体技能现在也可通过Claude Code市场和Hermes Skills Hub获得。
Q&A
Q1:英伟达Agent Toolkit是什么?它能做什么?
A:英伟达Agent Toolkit是一套综合性软件套件,包含开源模型和蓝图,用于构建强大的、可长时间运行的数字协作者。它为开发者提供将强大的前沿模型转化为功能完整的AI智能体所需的一切,包括高度优化的模型和安全运行时环境,能够执行跨业务运营、工程和网络安全任务的复杂工作流程。
Q2:NemoClaw框架在Agent Toolkit中起什么作用?
A:NemoClaw是Agent Toolkit的核心,是一个新框架,作为构建智能体编排层的主要蓝图。通过NemoClaw,开发者可以访问现成的模板,这些模板构建了智能体规划、推理、执行和委派任务的方式,为企业软件开发者提供了开放的构建模块,以创建更安全、可长时间运行的AI协作者。
Q3:Nemotron 3 Ultra模型有什么特点?
A:Nemotron 3 Ultra是一个专为长时间运行的自主智能体构建的大规模新型5500亿参数混合专家模型。它能够在编码和研究工作流程中实现前沿级别的推理,推理速度比同类前沿模型快五倍,运行成本降低30%,专门为自主智能体的长期运行而优化。
好文章,需要你的鼓励
随着制造商面临提升生产力、质量和韧性的压力,自动化正成为现代工厂运营的核心。全球最大合同制造商之一Flex近期扩大了与Teradyne Robotics的合作,将在自有工厂部署机器人解决方案并为客户制造关键机器人组件。该公司运营卓越与转型总裁分享了从试点项目到大规模实施的经验,探讨协作机器人、自主移动机器人如何平衡灵活性与标准化,以及物理AI在工厂环境中的实际应用前景。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
仓储自动化已进入新阶段,技术挑战从单一任务验证转向规模化部署。Plus One Robotics运营副总裁Christina Gomez-Terry分享了该公司累计完成20亿次拣选后的经验:硬件故障往往在大规模部署后才显现,可维护性和可靠性比峰值性能更重要,人机协作将是长期运营模式,而系统集成可能成为仓储自动化的下一个主要瓶颈。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。