自动驾驶汽车以及能够行走、交谈并与我们并肩工作的人形机器人,是 AI 在不久的将来改变世界的两个令人惊叹的方式。
但要想安全有效地运行,这些物理 AI 工具和应用必须能够理解现实世界。
在今年的拉斯维加斯消费电子展上,NVIDIA 刚刚宣布推出其 Cosmos 平台,该平台旨在加速物理 AI 系统的开发。
被称为"机器人领域的 ChatGPT 时刻",Cosmos 能够生成海量合成数据。尽管这些数据是人工创建的,但它们与真实世界足够接近,足以让机器人、自动驾驶汽车和其他物理 AI 算法从中学习。
然而,一些人认为,无论多少合成数据都无法完全模拟机器需要准备应对的所有现实场景。这就是为什么特斯拉花费多年时间,通过其搭载传感器的汽车收集真实世界数据的原因。CEO 埃隆·马斯克在推特上写道:"两种数据可以无限扩展:合成数据存在'是否真实?'的问题,而真实世界的视频则不存在这个问题。"
争论的焦点在于,合成数据缺乏真实世界的混沌不可预测性和复杂性,而这些对于构建全面且安全的 AI 系统至关重要。让我们更详细地探讨这个问题。
合成数据与真实世界数据的对比
在自动驾驶系统中,视觉数据(图像)用于训练算法,决定车辆如何对道路上的不同条件和情况做出反应。这些数据可以通过安装在车辆上的摄像头捕获(真实世界数据),也可以由 AI 算法根据研究真实世界数据所学到的规则生成(合成数据)。
这两种方法都有其优势和劣势。
合成数据的收集通常比真实世界数据更快、更经济。无需实地收集数据,只需由机器生成即可。
这也能带来安全方面的好处。例如,在道路上测试自动驾驶汽车显然存在一定风险,但如果只是模拟行驶,这些风险就可以消除。
此外,情境、环境和许多其他变量都可以自定义,而不必等待理想的数据收集条件在现实世界中出现。例如,研究人员可以模拟罕见的天气事件,在危险场景中测试自动驾驶车辆,或模拟复杂的制造缺陷,而无需承担现实世界的风险或延迟。
生成合成数据还可以减少或消除现实世界中可能存在的隐私和数据保护问题,因为不存在敏感个人数据被意外存储或泄露的风险。
这种情况在收集真实世界数据时可能会发生。例如,自动驾驶汽车的摄像头捕获的车牌号码可能会被关联到车主并用于识别和追踪他们。
正如马斯克指出的,真实世界数据具有不可否认的真实性优势。难以通过合成方式生成的混沌和难以预测的人类行为,更有可能在真实数据中得到体现。
监管也可能是一个问题。AI 相关法律正在快速发展,监管机构可能会出于安全考虑,要求某些模型或应用在特定时期或特定地区必须使用真实世界数据进行训练。
权衡选择
事实上,真实世界数据和合成数据对于训练下一代物理 AI 车辆和机器人都至关重要。
两者都具有独特的优势和挑战,采用混合方法可能是通往成功的最佳途径。
关键在于识别哪种方法最适合特定用例。例如,合成数据可能更适用于处理敏感信息或在危险条件下操作的任务或应用。
而真实世界数据则可能在捕捉动态人类行为或可能遇到混沌不可预见事件的情况下表现更好。
这意味着,采用平衡方法的 AI 项目,由理解合成数据和真实世界数据如何相辅相成而非相互竞争的人员领导,更有可能创造真正的商业价值。
好文章,需要你的鼓励
Kollmorgen发布NDC布局助手软件工具,专为工厂和仓库中的自动导引车(AGV)及自主移动机器人(AMR)的路线规划与优化而设计。该工具通过分段分析路线,帮助工程师在系统部署前识别瓶颈与低效环节,提供行驶时间、车速及优化潜力等关键数据,并以可视化方式标注问题区域,从而缩短布局设计与验证周期。Kollmorgen表示,该工具未来还将融入AI驱动的优化能力。
这篇由加州大学圣地亚哥分校等六所机构联合发布的综述(arXiv:2605.02913,2026年4月),首次系统梳理了大型语言模型强化学习训练中长期被忽视的轨迹设计问题,提出了GFCR四模块框架(生成、过滤、控制、回放),覆盖数学、代码、多模态和智能代理等多个应用场景,并附有实用的故障诊断手册,为AI训练工程师提供系统性的方法论指导。
现代仓储已从幕后走向前台,配送速度成为品牌竞争核心。面对次日达甚至两小时送达的市场压力,领先履约中心借鉴敏捷开发理念,以周为单位迭代代码、机器人与工作流程。IoT信标、边缘计算与视觉识别模块构建双层架构,实现厘米级货盘追踪与低延迟决策。人机协作模式让员工从重体力劳动转向异常处理与数据分析,拣选准确率突破99%。同时,自动化系统实时采集碳排放数据,在提速的同时实现可量化的减排目标。
中国科学技术大学与FrameX.AI联合提出Stream-R1框架,针对AI视频生成蒸馏训练中"一视同仁"的核心缺陷,引入奖励模型对训练样本进行双重加权:在样本层面根据质量分数筛选可靠的学习信号,在像素与帧层面通过梯度显著性热力图集中优化最需改进的区域,使4步快速学生模型在VBench多项指标上超越慢速多步教师模型,推理速度提升30倍且不增加任何额外计算开销。