英伟达在周一发布了一系列新的世界AI模型、库和其他面向机器人开发者的基础设施,其中最引人注目的是Cosmos Reason,这是一个拥有70亿参数的"推理"视觉语言模型,专门用于物理AI应用和机器人。
除了现有的Cosmos世界模型批次外,新加入的还有Cosmos Transfer-2,它可以加速从3D仿真场景或空间控制输入生成合成数据,以及一个经过蒸馏优化的Cosmos Transfers版本,更注重速度优化。
在周一SIGGRAPH会议的发布会上,英伟达指出,这些模型旨在用于创建合成文本、图像和视频数据集,以训练机器人和AI智能体。
据英伟达介绍,Cosmos Reason凭借其记忆和物理理解能力,让机器人和AI智能体能够进行"推理",使其能够"作为规划模型来推理具身智能体可能采取的下一步行动"。该公司表示,它可用于数据整理、机器人规划和视频分析。
该公司还发布了新的神经重建库,其中包括一种渲染技术,让开发者能够使用传感器数据在3D环境中模拟真实世界。这种渲染能力也正在集成到开源模拟器CARLA中,这是一个受欢迎的开发者平台。Omniverse软件开发套件也获得了更新。
机器人工作流程也有新的服务器支持。英伟达RTX Pro Blackwell服务器为机器人开发工作负载提供单一架构,而英伟达DGX Cloud则是基于云的管理平台。
这些发布正值这家半导体巨头进一步进军机器人领域,寻求其AI GPU在AI数据中心之外的下一个重大应用场景。
Q&A
Q1:Cosmos Reason是什么?它有什么功能?
A:Cosmos Reason是英伟达发布的一个拥有70亿参数的"推理"视觉语言模型,专门用于物理AI应用和机器人。它凭借记忆和物理理解能力,让机器人和AI智能体能够进行推理,作为规划模型来推理具身智能体可能采取的下一步行动,可用于数据整理、机器人规划和视频分析。
Q2:Cosmos Transfer-2有什么特点?
A:Cosmos Transfer-2是英伟达新发布的世界模型之一,它的主要特点是能够加速从3D仿真场景或空间控制输入生成合成数据。此外,还有一个经过蒸馏优化的Cosmos Transfers版本,更注重速度优化。
Q3:英伟达为什么要进军机器人领域?
A:英伟达进军机器人领域是因为该公司正在寻求其AI GPU在AI数据中心之外的下一个重大应用场景。作为半导体巨头,英伟达希望通过提供机器人开发的基础设施和AI模型,拓展其GPU技术的应用范围。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
牛津、MIT等机构联合发布GauntletBench,测试显示最强AI智能体完成率仅19%,而普通人类完成率超80%,揭示AI在时间感知、图形理解和三维推理上的真实短板。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
论文提出"盲目信任问题":现有视频AI将每帧画面等权处理,遭遇干扰时准确率暴跌却浑然不知。Robust-TO通过逐帧质量评估、置信度引导工具路由和分级证据推理三阶段框架解决这一缺陷。