英伟达在温哥华举行的ACM SIGGRAPH 2025计算机图形学大会上宣布,将扩展其智能AI模型产品线,推出面向机器人的物理智能技术和强大的企业AI服务器。
**Blackwell RTX Pro服务器GPU正式发布**
英伟达推出了专为服务器设计的RTX Pro 6000 Blackwell Server Edition GPU,现已面向企业服务器市场。这款采用2U机架式设计的服务器基于Blackwell架构,能够高速运行大语言模型并提供高性能AI推理工作负载。
英伟达创始人兼首席执行官黄仁勋表示:"AI正在60年来首次重新定义计算——从云端开始的变革现在正在改变本地数据中心的架构。"
新的Blackwell RTX Pro服务器为传统基于CPU的工作负载带来GPU加速,包括数据分析、仿真、视频处理和图形渲染,性能提升高达45倍。据英伟达介绍,与纯CPU系统相比,能效提高18倍,成本显著降低。
英伟达正与思科、戴尔科技、惠普企业、联想集团和超微电脑等厂商合作,提供各种配置的新服务器。
**智能体AI的更智能模型**
人工智能智能体正成为快速增长市场的基础,越来越多的组织采用其自主能力。这些智能体能够对复杂任务进行推理,并在更长的时间范围内制定计划。
英伟达宣布扩展其Nemotron模型家族,推出两款具有先进推理能力的新模型:Nemotron Nano 2和Llama Nemotron Super 1.5,用于构建更智能的AI智能体。
公司表示,这些模型在科学推理、编程、工具使用、指令执行和对话等领域为其规模类别提供了高精度。这些模型旨在为智能体赋予更深层的认知能力,帮助AI系统探索选项、权衡决策并在定义的约束条件下交付结果。
Nemotron Nano 2相比同类其他模型,Token生成吞吐量提升高达6倍。Llama Nemotron Super 1.5提供顶级性能,在推理准确性方面领先,适合处理复杂的企业任务。
英伟达正与企业合作伙伴和咨询领导者合作部署这些推理模型,包括计划将Nemotron集成到其AI助手中的Zoom、在其Charlotte AI智能体中测试模型用于编写网络安全查询的CrowdStrike,以及采用Nemotron Nano 2赋能分析业务数据智能体的安永。
**物理AI与推理机器人技术**
英伟达通过结合视觉信息摄取和思考能力的新AI模型,让机器人和机器能够"看见"并推理世界。
视觉语言模型(VLM)为机器人提供了计算机视觉,使其能够理解世界并与之交互,但缺乏对行动进行思考的能力。
英伟达今天宣布推出Cosmos Reason,这是一个开放、可定制的70亿参数推理VLM,专为物理AI视觉智能体和机器人设计。它使机器人和视觉智能体能够像人类一样思考所见内容,并利用从训练数据中获得的物理知识和常识等智能来规划场景。
公司表示,该技术能够帮助自动化大型多样化训练数据集的整理和标注,加速高精度AI模型的开发。它还可以作为机器人规划的复杂推理引擎,将复杂指令解析为VLA模型的步骤,即使在新环境中也能胜任。
这些新进展为智慧城市、设施和工业流程奠定了基础。英伟达表示,正与埃森哲、Belden、DeepHow、Milestone Systems和Telit Cinterion等公司合作,利用基于物理AI的感知和推理技术提高其场所的生产力和安全性。
基于传感器和视觉AI的基础设施能够感知、推理和反应,使用英伟达Metropolis平台,使为校园和设施开发和部署视频分析AI智能体和服务成为可能。
Q&A
Q1:Nemotron Nano 2和Llama Nemotron Super 1.5有什么特别之处?
A:这两款模型是英伟达Nemotron家族的新成员,具有先进推理能力。Nemotron Nano 2的Token生成吞吐量比同类模型提升6倍,而Llama Nemotron Super 1.5在推理准确性方面表现领先,适合处理复杂企业任务,能够帮助AI智能体进行科学推理、编程和工具使用等。
Q2:Cosmos Reason模型能为机器人带来什么改变?
A:Cosmos Reason是一个70亿参数的推理视觉语言模型,让机器人能够像人类一样思考所见内容。与传统视觉语言模型只能理解视觉信息不同,它结合了物理知识和常识,能够对场景进行规划推理,还可作为机器人规划的推理引擎,将复杂指令解析为可执行步骤。
Q3:Blackwell RTX Pro服务器相比传统CPU系统有哪些优势?
A:Blackwell RTX Pro服务器为传统CPU工作负载带来GPU加速,在数据分析、仿真、视频处理和图形渲染等方面性能提升高达45倍。相比纯CPU系统,能效提高18倍,成本显著降低,并且能够高速运行大语言模型,提供高性能AI推理工作负载。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。