英伟达在温哥华举行的ACM SIGGRAPH 2025计算机图形学大会上宣布,将扩展其智能AI模型产品线,推出面向机器人的物理智能技术和强大的企业AI服务器。
**Blackwell RTX Pro服务器GPU正式发布**
英伟达推出了专为服务器设计的RTX Pro 6000 Blackwell Server Edition GPU,现已面向企业服务器市场。这款采用2U机架式设计的服务器基于Blackwell架构,能够高速运行大语言模型并提供高性能AI推理工作负载。
英伟达创始人兼首席执行官黄仁勋表示:"AI正在60年来首次重新定义计算——从云端开始的变革现在正在改变本地数据中心的架构。"
新的Blackwell RTX Pro服务器为传统基于CPU的工作负载带来GPU加速,包括数据分析、仿真、视频处理和图形渲染,性能提升高达45倍。据英伟达介绍,与纯CPU系统相比,能效提高18倍,成本显著降低。
英伟达正与思科、戴尔科技、惠普企业、联想集团和超微电脑等厂商合作,提供各种配置的新服务器。
**智能体AI的更智能模型**
人工智能智能体正成为快速增长市场的基础,越来越多的组织采用其自主能力。这些智能体能够对复杂任务进行推理,并在更长的时间范围内制定计划。
英伟达宣布扩展其Nemotron模型家族,推出两款具有先进推理能力的新模型:Nemotron Nano 2和Llama Nemotron Super 1.5,用于构建更智能的AI智能体。
公司表示,这些模型在科学推理、编程、工具使用、指令执行和对话等领域为其规模类别提供了高精度。这些模型旨在为智能体赋予更深层的认知能力,帮助AI系统探索选项、权衡决策并在定义的约束条件下交付结果。
Nemotron Nano 2相比同类其他模型,Token生成吞吐量提升高达6倍。Llama Nemotron Super 1.5提供顶级性能,在推理准确性方面领先,适合处理复杂的企业任务。
英伟达正与企业合作伙伴和咨询领导者合作部署这些推理模型,包括计划将Nemotron集成到其AI助手中的Zoom、在其Charlotte AI智能体中测试模型用于编写网络安全查询的CrowdStrike,以及采用Nemotron Nano 2赋能分析业务数据智能体的安永。
**物理AI与推理机器人技术**
英伟达通过结合视觉信息摄取和思考能力的新AI模型,让机器人和机器能够"看见"并推理世界。
视觉语言模型(VLM)为机器人提供了计算机视觉,使其能够理解世界并与之交互,但缺乏对行动进行思考的能力。
英伟达今天宣布推出Cosmos Reason,这是一个开放、可定制的70亿参数推理VLM,专为物理AI视觉智能体和机器人设计。它使机器人和视觉智能体能够像人类一样思考所见内容,并利用从训练数据中获得的物理知识和常识等智能来规划场景。
公司表示,该技术能够帮助自动化大型多样化训练数据集的整理和标注,加速高精度AI模型的开发。它还可以作为机器人规划的复杂推理引擎,将复杂指令解析为VLA模型的步骤,即使在新环境中也能胜任。
这些新进展为智慧城市、设施和工业流程奠定了基础。英伟达表示,正与埃森哲、Belden、DeepHow、Milestone Systems和Telit Cinterion等公司合作,利用基于物理AI的感知和推理技术提高其场所的生产力和安全性。
基于传感器和视觉AI的基础设施能够感知、推理和反应,使用英伟达Metropolis平台,使为校园和设施开发和部署视频分析AI智能体和服务成为可能。
Q&A
Q1:Nemotron Nano 2和Llama Nemotron Super 1.5有什么特别之处?
A:这两款模型是英伟达Nemotron家族的新成员,具有先进推理能力。Nemotron Nano 2的Token生成吞吐量比同类模型提升6倍,而Llama Nemotron Super 1.5在推理准确性方面表现领先,适合处理复杂企业任务,能够帮助AI智能体进行科学推理、编程和工具使用等。
Q2:Cosmos Reason模型能为机器人带来什么改变?
A:Cosmos Reason是一个70亿参数的推理视觉语言模型,让机器人能够像人类一样思考所见内容。与传统视觉语言模型只能理解视觉信息不同,它结合了物理知识和常识,能够对场景进行规划推理,还可作为机器人规划的推理引擎,将复杂指令解析为可执行步骤。
Q3:Blackwell RTX Pro服务器相比传统CPU系统有哪些优势?
A:Blackwell RTX Pro服务器为传统CPU工作负载带来GPU加速,在数据分析、仿真、视频处理和图形渲染等方面性能提升高达45倍。相比纯CPU系统,能效提高18倍,成本显著降低,并且能够高速运行大语言模型,提供高性能AI推理工作负载。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。