英伟达公司今日宣布推出新工具,旨在推进物理人工智能模型的开发,如用于自动驾驶汽车、仓库和人形机器人的模型。
世界基础模型 (WFMs) 通过生成和模拟虚拟世界及其物理交互,帮助工程师和开发人员在各种场景中训练机器人。
在 2025 年 CES 展会上,英伟达宣布推出首个 Cosmos WFMs 系列,用于基于物理的仿真和合成数据生成。除了这些 AI 基础模型外,该公司还提供了分词器、护栏和 AI 模型定制功能,使开发人员能够根据需求微调模型。
英伟达联合创始人兼首席执行官黄仁勋表示:"物理 AI 将彻底改变价值 50 万亿美元的制造和物流行业。所有移动的东西——从汽车和卡车到工厂和仓库——都将由 AI 驱动的机器人实现。"
Cosmos 是一组世界基础模型,经过超过 9 万亿个 token 的训练,这些 token 来自 2000 万小时的真实世界人类交互、环境、工业、机器人和驾驶数据。这使得该模型系列能够提供各种优化的仿真数据,用于实时、低延迟推理,并可提炼为定制模型。
开发人员可以使用 Cosmos 从文本或视频提示生成完整的虚拟世界。这将允许机器人开发人员和工程师生成和增强他们的合成数据,以在真实世界部署之前测试和调试他们的 AI 模型,通过根据自身需求快速生成虚拟环境。
英伟达 Omniverse 和仿真副总裁 Rev Lebaredian 表示:"当前的自动驾驶开发人员需要行驶数百万英里。更耗费资源的是处理、过滤和标记数千 PB 的捕获数据。而且物理测试是危险的。人形机器人开发者的风险很大,因为一个机器人原型可能价值数十万美元。"
最终,工程师和开发人员发现,无论他们收集多少真实世界数据都是不够的。他们仍然需要用额外的合成数据来增强数据,以训练和微调他们的 AI 模型,覆盖边缘案例和可能性,以确保严谨性和安全性。
Cosmos 可以与英伟达 Omniverse 无缝配对,后者是该公司的实时 3D 图形协作和仿真平台,允许艺术家、开发人员和企业使用完全实现的物理学构建工厂、城市和其他空间的真实 3D 模型和场景。通过这个工具,公司可以开发数字孪生,模拟真实世界环境,比将实体机器人投入实际训练营更容易地训练机器人。
开发人员现在可以从 NGC 目录和 Hugging Face 预览首个 Cosmos WFM 模型系列。
Omniverse 扩展物理 AI 生成能力
英伟达的数字孪生仿真和协作平台 Omniverse 新增了四个蓝图,以加速工业和机器人工作流程,包括开发和训练物理 AI 模型。
由 Omniverse Sensor RTX 应用程序接口驱动的 Mega,将帮助机器人和 AI 工程师在大规模部署到真实世界设施之前开发和测试物理 AI 机器人队伍。Mega 通过在虚拟世界中使用跨复杂场景的传感器数据模拟机器人行为,为企业提供数字孪生能力。
在仓库、配送中心和工厂中,自主移动机器人、机器人手臂和人形机器人可以与人一起工作,在过道中移动并相互交互。它提供了一个框架,允许跨虚拟环境的软件定义功能,用于传感器和机器人自主性测试和训练。
供应链解决方案公司 KION 集团和咨询公司埃森哲与英伟达合作,成为首批采用 Mega 来优化零售、消费品包装等领域运营的公司。
由 Omniverse Sensor RTX 驱动的自动驾驶车辆仿真将允许自动驾驶开发人员重放驾驶数据、生成新的基准数据并执行测试,以开发更好的 AI 模型。英伟达还发布了一个用于计算机辅助工程 (CAE) 实时数字孪生的参考工作流程蓝图,该蓝图基于英伟达 CUDA-X 加速、物理 AI 和 Omniverse 库构建,允许实时物理可视化。
英伟达的人形机器人 AI 学习模型 Isaac GR00T 获得了一个蓝图,允许用户戴上 Apple Vision Pro 并演示任务。通过观察和模仿人类演示来获取人形机器人的新技能。收集这些需要大量高质量数据集的捕获。
通过实施 GR00T 蓝图,并通过将捕获模拟为数字孪生来从少量人类演示生成大量合成数据集,可以缓解这项繁琐的任务。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。