英伟达在Computex大会上预告Nemotron 3 Ultra之后,于近日正式将这款拥有5500亿参数的开源混合专家模型发布至Hugging Face、ModelScope、OpenRouter(提供免费接入端点)以及build.nvidia.com等平台。
核心架构与技术特性
Nemotron 3 Ultra延续了Nemotron 3系列一贯采用的潜在混合专家技术与Mamba 2架构,将实际激活参数量压缩至550亿。该模型支持最高100万Token的上下文窗口,在处理超长文本任务时具备显著优势。
专为长时智能体任务优化
英伟达在发布说明中特别指出,Nemotron 3 Ultra经过专项调优,旨在驱动需要持续规划、工具调用以及复杂任务迭代处理的长时智能体应用。为此,该模型不仅需要具备足够的推理能力,还必须保持较快的推理速度。英伟达强调,此次发布的模型在速度方面相比上一代产品有了大幅提升。
在当前业界普遍关注Token成本的背景下,英伟达还宣称,与同等性能水平的模型相比,Nemotron 3 Ultra可帮助用户节省最多30%的使用成本。
性能表现与竞品对比
在与Kimi-K2.6、Qwen-3.5、GML-5.1等直接竞争对手的横向比较中,Nemotron 3 Ultra是速度最快的模型,同时也是目前性能最强的美国开源权重模型。不过,在大多数基准测试上,该模型仍与上述中国模型存在一定差距,分差虽不大,但确实落后。
在测试模型执行真实世界经济价值任务能力的GDPVal基准上,Nemotron 3 Ultra的NVFP4量化版本(采用英伟达全新量化感知预训练技术)得分为47.9%,而OpenAI的GPT-5.5得分高达84.9%,两者差距明显。
尽管如此,基准测试未必能全面反映模型的真实能力。英伟达指出,该模型能够胜任"自主工作流中的编排调度与最高难度推理任务,包括长时编程会话中的架构决策、跨数百个研究来源的综合分析,以及跨数千个相互依赖约束条件的验证工作"。
训练数据与开放协议
Nemotron 3 Ultra基于精心筛选的14.8万亿Token数据集进行训练,支持包括英语、法语、西班牙语、意大利语、德语、日语、韩语、印地语、巴西葡萄牙语和中文在内的12种自然语言,以及43种编程语言。
英伟达已公开发布该模型的权重文件、训练数据集及训练配方,模型采用OpenMDW-1.1许可协议进行授权。
Q&A
Q1:Nemotron 3 Ultra的5500亿参数是否都会被激活?
A:不是。Nemotron 3 Ultra采用混合专家(MoE)架构与潜在混合专家技术,虽然总参数量达到5500亿,但实际运行时只激活其中约550亿参数。这种设计在保持模型整体能力的同时,显著降低了推理计算开销,从而实现更快的推理速度。
Q2:Nemotron 3 Ultra与GPT-5.5相比差距有多大?
A:差距较为明显。在GDPVal基准测试中,Nemotron 3 Ultra的NVFP4量化版本得分为47.9%,而OpenAI的GPT-5.5得分高达84.9%,相差约37个百分点。不过,英伟达强调基准测试无法完整体现模型优势,该模型在长时自主工作流、复杂编程任务和多源研究综合等场景中具备独特能力。
Q3:Nemotron 3 Ultra支持哪些语言?在哪里可以使用?
A:Nemotron 3 Ultra支持12种自然语言,包括英语、法语、西班牙语、意大利语、德语、日语、韩语、印地语、巴西葡萄牙语和中文,同时支持43种编程语言。目前该模型已在Hugging Face、ModelScope、OpenRouter(提供免费端点)以及build.nvidia.com等平台上线,模型权重、数据集和训练配方均已开放,采用OpenMDW-1.1许可协议。
好文章,需要你的鼓励
欧洲量子计算初创公司Alice & Bob正式推出其首款完整量子硬件平台——Helium量子系统,标志着该公司从量子芯片制造商升级为完整系统开发商。该系统基于独特的"猫量子比特"架构,仅需18个猫量子比特即可实现首个逻辑量子比特的编码,并集成了处理器架构、控制电子设备及监控软件Starboard。系统功耗仅40千瓦,支持量子与经典计算资源的协同部署,面向高性能计算场景开放研究合作。
本研究发现AI视频生成中物理幻觉的根源是去噪过程中的相位侵蚀,并提出免训练方法PhaseLock,用两步推理的运动先验引导完整生成,物理一致性平均提升6.2分。
Intuit首席AI官Ashok Srivastava对外界盛传的"AI颠覆SaaS"论调保持冷静,认为SaaS行业的演变本是持续循环的一部分。他表示,公司通过引入AI智能体,过去一年开发速度提升40%,五年内开发效率提升12倍。QuickBooks Live订阅量因AI加入翻倍增长,QuickBooks Capital平台同比增长73%。Srivastava同时强调,Intuit拒绝"Token最大化"策略,坚持以服务客户为核心,在合规监管环境下稳步推进AI落地。
本研究测试了5种AI适配方法在11种音乐风格和弦预测上的表现,发现和弦符号确能携带风格信息但不完整,控制词条与完整适配器效果相当。