随着AI模型持续获得关注,开发能够连接设备屏幕与现实世界的硬件愈发重要。因此,物理AI成为CES展会的新兴主题,英伟达发布了多款模型来加速机器人开发。
"机器人领域的ChatGPT时刻已经到来。物理AI的突破——理解现实世界、推理和规划行动的模型——正在解锁全新的应用领域,"英伟达创始人兼CEO黄仁勋表示。
为了推动这一势头,英伟达在周一拉斯维加斯主题演讲中发布了全新的开源英伟达Cosmos和GR00T模型。该公司表示,这些模型旨在让开发者减少预训练的时间和资源投入,将更多精力用于构建下一代机器人。
具体而言,此次发布包括英伟达Cosmos Transfer 2.5和英伟达Cosmos Predict 2.5,这是开源且完全可定制的世界模型,能够理解现实世界,包括其物理和空间特性。这对创建合成数据和仿真非常有用,能够模拟现实生活场景来评估机器人性能,这在物理AI开发中十分必要,因为测试自动驾驶汽车等物理AI应用在现实中往往风险太高。
英伟达Cosmos Reason 2是一个开源推理视觉语言模型(VLM),使智能机器能够"像人类一样在物理世界中看见、理解和行动"。此外,使用英伟达Cosmos Reason 2,物理AI可以像人类一样做出决策,运用推理、先验知识、物理理解等能力。
最后,英伟达Isaac GR00T N1.6是专为人形机器人设计的开源推理视觉语言动作(VLA)模型,实现全身控制,并利用英伟达Cosmos Reason获得上述额外优势。所有新模型都可在Hugging Face平台获取。
基准测试和仿真对确保自主系统的安全开发至关重要,但由于创建仿真的难度,它们往往是机器人技术中最具挑战性的组成部分。为帮助弥合这一差距,英伟达在GitHub上发布了新的开源框架,包括英伟达Isaac Lab-Arena和英伟达OSMO。
英伟达Isaac Lab-Arena是一个专为大规模机器人策略评估和仿真基准测试设计的开源框架。它与具身AI基础设施公司Lightwheel密切合作开发,连接到行业领先的基准测试。
英伟达Osmo旨在帮助开发者完成机器人训练工作流程。特别是,它可以让开发者从一个中央指挥中心在不同计算环境中运行工作流程,如模型训练,从而加速整个过程。
英伟达表示正与Hugging Face合作,将开源Isaac和GR00T技术集成到LeRobot开源机器人框架中,使各经验层次的开发者更容易在机器人开发中使用英伟达技术。GR00T N1.6和Isaac Lab-Arena现已在LeRobot库中提供。
此次合作的另一部分是让Hugging Face的开源Reachy 2人形机器人与英伟达Jetson Thor硬件无缝协作。同样,Hugging Face的开源Reachy Mini桌面机器人与英伟达DGX Spark完全互操作。
包括波士顿动力、Richtech、Humanoid、LG电子和Neura Robotics在内的领先机器人公司都发布了使用英伟达技术构建的新型机器人和自主机器,集成了该公司的Jetson Thor机器人平台。
这些机器人协助完成不同任务。例如,Richtech Robotics推出了用于工业环境的人形机器人Dex,而LG电子发布了用于室内家务的新型家用机器人。CES发布的内容还包括新的英伟达Blackwell驱动的Jetson T4000模块,该公司声称其性能是上一代的四倍。
Q&A
Q1:英伟达发布的Cosmos模型有什么特点?
A:英伟达Cosmos包括Transfer 2.5和Predict 2.5,是开源且完全可定制的世界模型,能够理解现实世界的物理和空间特性。这些模型主要用于创建合成数据和仿真,模拟现实生活场景来评估机器人性能,因为在现实中测试自动驾驶汽车等物理AI应用往往风险太高。
Q2:GR00T N1.6模型的主要用途是什么?
A:英伟达Isaac GR00T N1.6是专门为人形机器人设计的开源推理视觉语言动作模型,能够实现全身控制功能。该模型利用英伟达Cosmos Reason技术,使人形机器人能够像人类一样进行推理、运用先验知识和理解物理世界,从而做出智能决策。
Q3:哪些知名公司在使用英伟达的机器人技术?
A:包括波士顿动力、Richtech、Humanoid、LG电子和Neura Robotics等领先机器人公司都发布了使用英伟达技术的新型机器人。例如,Richtech推出了工业环境用的人形机器人Dex,LG电子发布了室内家务机器人,这些都集成了英伟达的Jetson Thor机器人平台。
好文章,需要你的鼓励
随着AI广泛应用推动数据中心建设热潮,运营商面临可持续发展挑战。2024年底美国已建成或批准1240个数据中心,能耗激增引发争议。除能源问题外,服务器和GPU更新换代产生的电子废物同样严重。通过采用模块化可修复系统、AI驱动资产跟踪、标准化数据清理技术以及与认证ITAD合作伙伴合作,数据中心可实现循环经济模式,在确保数据安全的同时减少环境影响。
剑桥大学研究团队首次系统探索AI在多轮对话中的信心判断问题。研究发现当前AI系统在评估自己答案可靠性方面存在严重缺陷,容易被对话长度而非信息质量误导。团队提出P(SUFFICIENT)等新方法,但整体问题仍待解决。该研究为AI在医疗、法律等关键领域的安全应用提供重要指导,强调了开发更可信AI系统的紧迫性。
超大规模云数据中心是数字经济的支柱,2026年将继续保持核心地位。AWS、微软、谷歌、Meta、甲骨文和阿里巴巴等主要运营商正积极扩张以满足AI和云服务需求激增,预计2026年资本支出将超过6000亿美元。然而增长受到电力供应、设备交付和当地阻力制约。截至2025年末,全球运营中的超大规模数据中心达1297个,总容量预计在12个季度内翻倍。
威斯康星大学研究团队开发出Prithvi-CAFE洪水监测系统,通过"双视觉协作"机制解决了AI地理基础模型在洪水识别上的局限性。该系统巧妙融合全局理解和局部细节能力,在国际标准数据集上创造最佳成绩,参数效率提升93%,为全球洪水预警和防灾减灾提供了更准确可靠的技术方案。