Decart发布Oasis 3世界模型，为机器人训练注入真实感

前沿AI研究机构Decart发布最新世界模型Oasis 3，旨在弥合虚拟仿真与物理AI之间的鸿沟。该模型将超写实交互图形能力与强大物理引擎相结合，可生成动作驱动的视频流，支持多视角环境模拟，延迟低于200毫秒。开发者能够借助自然语言提示，快速构建多样化极端场景，有效解决机器人和自动驾驶领域长期存在的"仿真到现实"差距问题，大幅降低物理AI训练成本。

前沿AI研究机构Decart近日推出了最新世界模型Oasis 3，旨在弥合合成仿真与实体AI之间的鸿沟。

这款全新的视频输出模型专为加速机器人和自动驾驶汽车操作系统模型的训练而设计，目标是打造能够从容应对现实世界不确定性的智能硬件。

训练数据匮乏，机器人研发面临重大挑战

机器人开发者长期面临一大难题：用于训练机器在复杂物理环境中运作的有效数据严重不足。

自动驾驶汽车在固定锥桶的静态停车场中学会导航并不困难，但这类环境与真实道路相去甚远——尤其是在天气和光照条件不断变化的情况下。要让车辆在倾盆大雨中穿越混乱的城市街道，同时对突然冲出的狗做出即时反应，则是截然不同的挑战。Oasis 3正是为破解这一难题而生。

大语言模型的发展速度远超通用机器人（即实体AI）领域，根本原因在于前者拥有海量媒体资源可供利用。正如Bessemer Ventures在今年早些时候的研究报告中所指出的，大语言模型开发者可以从公共互联网上抓取数十亿网页，而驱动机器人与物理世界交互所需的视觉-语言-动作（VLA）模型却没有这种便利。

VLA模型的工作原理是摄取环境数据、处理并理解当前状况，最终对输入做出反应。在训练方式上，开发者目前有三条路可走。

第一种是自建远程操控数据，即让人穿上特制装备模拟机器人在特定场景中的动作。这种方式数据质量最高，但成本极高、效率极低，难以扩展到所需规模。

第二种是使用网络公开视频。此类资源数量充足，但因内容杂乱而实用性有限——环境缺乏一致性，无法按需复现所需的多样化条件，也缺少空间数据遥测和直接动作条件信息。

第三种是使用合成数据，介于前两者之间。但现有物理引擎质量参差不齐，因其规则边界僵硬，难以还原真实世界的细微变化。

研究人员将这种差距称为"仿真到现实的鸿沟"。简而言之，现有用于生成机器人虚拟训练环境的AI软件，根本无法模拟真实世界中千变万化的随机状况——例如路面油污或仓库中异常易碎的纸箱。一旦遭遇此类突发情况，自动驾驶汽车和机器人往往不知所措。

Oasis 3如何弥合仿真与现实的差距

Decart表示，Oasis 3的设计目标是突破现有虚拟训练环境的局限，将照片级真实感的交互式动态图形能力与强大的物理引擎融为一体。

两者被整合在一个高性能训练循环中，使Oasis 3能够生成动作条件化视频流，开发者可以在其中模拟几乎任何能够想象到的混乱场景，从而构建出更贴近物理世界的优质训练环境。

开发者可利用Oasis 3创建多视角环境，既高度逼真，又可精确控制。当自动驾驶汽车向左偏转时，实时生成流会在200毫秒以内即时调整视角，完全满足强化学习所需的延迟要求。

该模型与英伟达的实体AI生态系统协同设计，运行于CoreWeave的专用云基础设施之上，帧率达到每秒22帧，可生成512×768×3分辨率的交互式虚拟环境。

Oasis 3原生支持三摄像头视角，以确保多角度的空间与时间一致性，帮助自主系统准确判断深度和周边环境。该模型通过Decart的API对外开放，开发者可轻松将其集成到现有的实体AI仿真工作流程中。

无限场景生成，让机器人为一切意外做好准备

要让实体AI达到科幻作品中类人机器人的水平，开发者必须能够实时训练机器人应对各种极端边缘案例。

这意味着需要创造出在实验室中根本无法复现的场景，例如：一辆卡车在行驶中货物脱落，恰好落在一辆摄像头已被泥巴遮住的自动驾驶车辆前方。

这正是Oasis 3能够实现的场景类型。借助简单的自然语言提示，开发者可以生成此类事件的无限变体——涵盖多种拍摄角度、各类恶劣天气条件以及不同路面类型。

开发者或许终于找到了一种经济实惠的方式，让自己的模型接触数百万种不同的危险场景，确保其能够应对现实世界中一切可能发生的突发情况。

Q&A

Q1：Oasis 3是什么？它主要解决什么问题？

A：Oasis 3是由AI研究机构Decart推出的世界模型，专为机器人和自动驾驶汽车的训练而设计。它的核心目标是弥合"仿真到现实的鸿沟"——即现有虚拟训练环境无法真实还原现实世界复杂性和随机性的问题。通过融合照片级真实感图形与强大物理引擎，Oasis 3能够生成高度逼真且可控的训练场景，帮助自主系统为现实中的各种极端情况做好准备。

Q2：VLA模型的训练为什么这么难？

A：VLA（视觉-语言-动作）模型需要摄取环境数据、理解当前状况并做出反应，对训练数据的质量和多样性要求极高。现有三种训练方式各有局限：远程操控数据质量高但成本极高难以规模化；网络公开视频数量多但内容杂乱、缺乏空间数据；合成数据介于两者之间，但受限于物理引擎的僵化规则，难以模拟真实世界的细微变化和随机事件。

Q3：Oasis 3的技术性能指标是怎样的？

A：Oasis 3运行于CoreWeave的专用云基础设施之上，与英伟达实体AI生态协同设计，能够以每秒22帧的速度生成512×768×3分辨率的交互式虚拟环境。在响应延迟方面，当自动驾驶车辆改变方向时，视角调整延迟低于200毫秒，满足强化学习的实时性需求。此外，Oasis 3原生支持三摄像头视角，保证多角度的空间与时间一致性，并通过API向开发者开放集成。

来源：Robotics and Automation News

0赞

好文章，需要你的鼓励

Decart发布Oasis 3世界模型，为机器人训练注入真实感

来源：Robotics and Automation News

2026

06/11

22:43

分享

点赞

仿人机器人视觉与运动技术的精细调校

抵御AI驱动的数据融合攻击：芯片安全防护的关键挑战

AI数据中心与汽车行业在能源管理领域的技术融合

GLM-5.2海外爆火，我们翻了1500条评论，看看用户在讨论什么

电动自行车的功过之辩：被忽视的那一面

Neo：印度科技大亨自掏3000万美元，打造微软Office的AI替代品

AI数据中心如何获得电网接入资格？公用事业公司的规划逻辑解析

Brookfield与Bloom能源将融资规模扩至250亿美元，押注AI数据中心独立供电

当CIO的技术提案遭到否决，该如何应对？

这款谷歌实验室 AI 应用如何成为我每日必用的工具

起亚EV5推出Storm特别版并新增全轮驱动选项

Meta效仿SpaceX，将过剩AI算力变现

AI既令人兴奋又让人焦虑，企业究竟该如何面对？

芬兰与瑞典联手推进6G韧性联合研究计划

微软公布智能体AI系统七大新型安全漏洞

GitHub Copilot推出桌面应用与画布功能，同步启用按量计费模式

谷歌DeepMind分拆公司如何追踪隐藏的药物靶点

Snowflake峰会观察：智能体浪潮下平台的核心竞争力之争

亚马逊"故事回顾"功能正式向美国Kindle设备及iPhone应用推出

Anthropic推出聚焦生命科学的全新大语言模型

Motive AI Coach智能驾驶辅导系统正式进军英国市场

Google Cloud深度解析AI智能体治理难题

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: