物理AI正从研究实验室走向现实世界,为智能机器人和自动驾驶汽车(如自动驾驶出租车)提供动力。这些系统必须在不可预测的环境中可靠地感知、推理和行动。
为了安全地扩展这些系统,开发者需要能够连接现实世界数据、高保真仿真和强大AI模型的工作流程,这些都建立在OpenUSD框架提供的通用基础之上。
最近发布的OpenUSD核心规范1.0版本定义了标准数据类型、文件格式和组合行为,为开发者在扩展自动驾驶系统时提供可预测、可互操作的USD管道。
基于OpenUSD,NVIDIA Omniverse库结合NVIDIA RTX渲染、物理仿真和高效运行时,创建数字孪生和仿真就绪资产,准确反映现实环境,用于合成数据生成和测试。
NVIDIA Cosmos世界基础模型可以在这些仿真之上运行,扩大数据变化范围,从相同场景生成新的天气、光照和地形条件,让团队安全覆盖罕见和具有挑战性的边缘案例。
开放标准和仿真就绪资产
OpenUSD核心规范1.0确立了支撑仿真就绪资产的标准数据模型和行为,使开发者能够在OpenUSD基础上构建AI工厂和机器人的可互操作仿真管道。
基于这一基础,仿真就绪3D资产可以跨工具和团队重复使用,并直接加载到NVIDIA Isaac Sim中,其中USDPhysics碰撞器、刚体动力学和基于组合弧的变体让团队在虚拟设施中测试机器人,这些设施与实际操作密切相关。
开源学习
Learn OpenUSD课程现已开源并在GitHub上提供,使贡献者能够为不同受众、语言和用例本地化和改编模板、练习和内容。这为教育者提供了一个现成的基础,将新团队引入以OpenUSD为中心的仿真工作流程。
生成式世界作为安全倍增器
高斯飞溅技术使用可编辑的3D元素快速高保真地渲染环境,与世界模型一起加速安全机器人测试和验证的仿真管道。
在SIGGRAPH Asia上,NVIDIA研究团队推出了Play4D,这是一个流媒体管道,使4D高斯飞溅能够准确渲染动态场景并提高真实感。
空间智能公司World Labs正在使用其Marble生成式世界模型与NVIDIA Isaac Sim和Omniverse NuRec,让研究人员可以将文本提示和样本图像转换为逼真的、基于高斯的物理就绪3D环境,时间从几周缩短到几小时。
这些世界然后可用于物理AI训练、测试和从仿真到现实的转移。这种高保真仿真工作流程扩展了机器人可以练习的场景范围,同时将实验安全地保持在仿真中。
Lightwheel帮助团队扩展机器人训练
基于OpenUSD,Lightwheel的仿真就绪资产库包含通用场景描述层,便于为机器人组装高保真数字孪生。这些仿真就绪资产嵌入了精确的几何、材料和经过验证的物理属性,可以直接加载到NVIDIA Isaac Sim和Isaac Lab中进行机器人训练。
自动驾驶汽车安全认证
端到端自动驾驶汽车安全进展正在通过新研究、开放框架和检查服务加速,使验证更加严格和可扩展。
NVIDIA研究人员与哈佛大学和斯坦福大学的合作者最近推出了Sim2Val框架,统计性地结合现实世界和仿真测试结果,减少自动驾驶汽车开发者对昂贵物理里程的需求,同时展示自动驾驶出租车和自动驾驶汽车如何在罕见和安全关键场景中安全行为。
这些创新得到了新的开源NVIDIA Omniverse NuRec Fixer的补充,这是一个基于Cosmos的模型,在自动驾驶汽车数据上训练,用于去除神经重建中的伪影,产生更高质量的仿真就绪资产。
为了将这些进展与严格的全球标准保持一致,经ANAB认证的NVIDIA Halos AI系统检查实验室通过Halos认证计划为自动驾驶出租车车队、自动驾驶汽车堆栈、传感器和制造商平台的Halos元素提供公正检查和认证。
自动驾驶汽车生态系统领导者实践物理AI安全
博世、Nuro和Wayve是NVIDIA Halos AI系统检查实验室的首批参与者,该实验室旨在加速自动驾驶出租车车队的安全大规模部署。为自动驾驶汽车、工业自动化和医疗应用制造传感器系统的onsemi最近成为首家通过NVIDIA Halos AI系统检查实验室检查的公司。
开源CARLA仿真器集成NVIDIA NuRec和Cosmos Transfer来生成重建的驾驶和多样化场景变化,而Voxel51的FiftyOne引擎与Cosmos Dataset Search、NuRec和Cosmos Transfer相连,帮助团队在整个自动驾驶汽车管道中策划、注释和评估多模态数据集。
密歇根大学的Mcity正在使用Omniverse库和技术增强其32英亩自动驾驶汽车测试设施的数字孪生。团队正在集成NVIDIA自动驾驶汽车仿真蓝图和Omniverse Sensor RTX应用程序编程接口,创建摄像头、激光雷达、雷达和超声波传感器的基于物理的模型。
通过将真实传感器记录与高保真仿真数据对齐并公开共享资产,Mcity使车辆在公共道路上运行之前能够安全、可重复地测试罕见和危险的驾驶场景。
Q&A
Q1:OpenUSD核心规范1.0有什么重要作用?
A:OpenUSD核心规范1.0定义了标准数据类型、文件格式和组合行为,为开发者在扩展自动驾驶系统时提供可预测、可互操作的USD管道,建立了支撑仿真就绪资产的标准数据模型和行为。
Q2:NVIDIA Halos AI系统检查实验室提供什么服务?
A:经ANAB认证的NVIDIA Halos AI系统检查实验室通过Halos认证计划为自动驾驶出租车车队、自动驾驶汽车堆栈、传感器和制造商平台的Halos元素提供公正检查和认证,目前博世、Nuro、Wayve等公司已参与其中。
Q3:高斯飞溅技术在物理AI安全中起什么作用?
A:高斯飞溅技术使用可编辑的3D元素快速高保真地渲染环境,与世界模型结合加速安全机器人测试和验证的仿真管道,能够将文本提示和样本图像转换为逼真的物理就绪3D环境,用于物理AI训练和测试。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。