英伟达周一在其GTC大会上宣布成立Nemotron联盟。这个全新的AI实验室联盟将汇集专业知识、数据和评估能力,共同构建共享的基础模型,而英伟达负责在其DGX云基础设施上进行训练。该联盟的首个项目是一个目前正在训练的新基础模型,它将为即将推出的Nemotron 4系列奠定基础。
创始成员包括Black Forest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection AI、Sarvam和Thinking Machines Lab。其中几家公司已经与英伟达建立了合作关系。例如,以Flux图像模型闻名的Black Forest Labs一直在与英伟达就模型优化进行合作,而Perplexity和LangChain已经在其平台中集成了英伟达的Nemotron模型。
核心信息似乎是,这些基础模型正在成为基本门槛,并不一定能让这些公司实现差异化竞争。相反,是训练后处理和其他工作让它们能够将这些模型变成自己的产品。
英伟达企业生成式AI软件副总裁Kari Briski在发布前的新闻发布会上表示:"构建前沿模型需要大量时间、专业知识和计算资源——这是大多数组织无法独自承担的重大投资。虽然许多人想要开放模型,但很少有人拥有独立构建它们的资源。与其让每个团队在相同的基础模型上重复努力,我们正在共同构建一个共享的开放基础。"
毕竟,开发前沿开放模型需要巨大的计算资源,只有像OpenAI、Anthropic、谷歌——以及英伟达——这样的公司才能独立投资。联盟成员不再各自重复相同的基础模型训练,而是贡献领域专业知识、数据和评估,英伟达提供DGX云计算。生成的基础模型是开放的,参与者——或任何其他人——都可以根据自己的用例对其进行调优。
除了联盟及其构建Nemotron 4模型的计划外,英伟达还宣布了Nemotron 3系列的最新成员:Nemotron 3 Ultra。
英伟达去年首次宣布了Ultra模型的计划。当时,该公司表示它将拥有5000亿个参数,其中500亿个为活跃参数。
遗憾的是,该模型尚未发布。英伟达表示已完成训练,并称其为"世界上最好的开放基础模型",但我们还需要在实践中看到其表现。
英伟达还重点介绍了Nemotron 3 Super,这是一个拥有1200亿参数的混合Mamba-Transformer模型,具有120亿个活跃参数。这个较小的模型于3月11日发布,在PinchBench上得分85.6%,该基准测试评估大语言模型作为OpenClaw智能体大脑的表现。据英伟达称,这使其成为该基准测试中得分最高的开放模型,总体排名第四。它具有原生100万Token上下文窗口,专为长期运行的智能体工作流程而设计。
Q&A
Q1:Nemotron联盟是什么?它的目的是什么?
A:Nemotron联盟是英伟达在GTC大会上宣布成立的AI实验室联盟,旨在汇集专业知识、数据和评估能力,共同构建共享的基础模型。联盟成员贡献领域专业知识、数据和评估,英伟达提供DGX云计算资源进行训练。
Q2:为什么要成立这个联盟而不是各自独立开发?
A:构建前沿模型需要大量时间、专业知识和计算资源,是大多数组织无法独自承担的重大投资。与其让每个团队在相同的基础模型上重复努力,联盟成员可以共同构建共享的开放基础,然后根据自己的用例对模型进行调优。
Q3:Nemotron 3 Ultra有什么特点?
A:Nemotron 3 Ultra拥有5000亿个参数,其中500亿个为活跃参数。英伟达称其为"世界上最好的开放基础模型",已完成训练但尚未发布。另外还有Nemotron 3 Super,具有1200亿参数和原生100万Token上下文窗口。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。