特斯拉与英伟达在 AI 系统训练上为何选择不同路径

特斯拉和英伟达在AI系统训练方面采取了不同策略。英伟达推出Cosmos平台,利用合成数据加速物理AI系统开发。而特斯拉则坚持使用真实世界数据,认为合成数据无法完全模拟复杂的现实场景。两种方法各有优劣,未来可能需要平衡使用以创造真正的商业价值。

自动驾驶汽车以及能够行走、交谈并与我们并肩工作的人形机器人，是 AI 在不久的将来改变世界的两个令人惊叹的方式。

但要想安全有效地运行，这些物理 AI 工具和应用必须能够理解现实世界。

在今年的拉斯维加斯消费电子展上，NVIDIA 刚刚宣布推出其 Cosmos 平台，该平台旨在加速物理 AI 系统的开发。

被称为"机器人领域的 ChatGPT 时刻"，Cosmos 能够生成海量合成数据。尽管这些数据是人工创建的，但它们与真实世界足够接近，足以让机器人、自动驾驶汽车和其他物理 AI 算法从中学习。

然而，一些人认为，无论多少合成数据都无法完全模拟机器需要准备应对的所有现实场景。这就是为什么特斯拉花费多年时间，通过其搭载传感器的汽车收集真实世界数据的原因。CEO 埃隆·马斯克在推特上写道："两种数据可以无限扩展：合成数据存在'是否真实？'的问题，而真实世界的视频则不存在这个问题。"

争论的焦点在于，合成数据缺乏真实世界的混沌不可预测性和复杂性，而这些对于构建全面且安全的 AI 系统至关重要。让我们更详细地探讨这个问题。

合成数据与真实世界数据的对比

在自动驾驶系统中，视觉数据（图像）用于训练算法，决定车辆如何对道路上的不同条件和情况做出反应。这些数据可以通过安装在车辆上的摄像头捕获（真实世界数据），也可以由 AI 算法根据研究真实世界数据所学到的规则生成（合成数据）。

这两种方法都有其优势和劣势。

合成数据的收集通常比真实世界数据更快、更经济。无需实地收集数据，只需由机器生成即可。

这也能带来安全方面的好处。例如，在道路上测试自动驾驶汽车显然存在一定风险，但如果只是模拟行驶，这些风险就可以消除。

此外，情境、环境和许多其他变量都可以自定义，而不必等待理想的数据收集条件在现实世界中出现。例如，研究人员可以模拟罕见的天气事件，在危险场景中测试自动驾驶车辆，或模拟复杂的制造缺陷，而无需承担现实世界的风险或延迟。

生成合成数据还可以减少或消除现实世界中可能存在的隐私和数据保护问题，因为不存在敏感个人数据被意外存储或泄露的风险。

这种情况在收集真实世界数据时可能会发生。例如，自动驾驶汽车的摄像头捕获的车牌号码可能会被关联到车主并用于识别和追踪他们。

正如马斯克指出的，真实世界数据具有不可否认的真实性优势。难以通过合成方式生成的混沌和难以预测的人类行为，更有可能在真实数据中得到体现。

监管也可能是一个问题。AI 相关法律正在快速发展，监管机构可能会出于安全考虑，要求某些模型或应用在特定时期或特定地区必须使用真实世界数据进行训练。

权衡选择

事实上，真实世界数据和合成数据对于训练下一代物理 AI 车辆和机器人都至关重要。

两者都具有独特的优势和挑战，采用混合方法可能是通往成功的最佳途径。

关键在于识别哪种方法最适合特定用例。例如，合成数据可能更适用于处理敏感信息或在危险条件下操作的任务或应用。

而真实世界数据则可能在捕捉动态人类行为或可能遇到混沌不可预见事件的情况下表现更好。

这意味着，采用平衡方法的 AI 项目，由理解合成数据和真实世界数据如何相辅相成而非相互竞争的人员领导，更有可能创造真正的商业价值。

来源：Forbes

0赞

好文章，需要你的鼓励

特斯拉与英伟达在 AI 系统训练上为何选择不同路径

来源：Forbes

2025

01/13

16:13

分享

点赞

Xbox 的 Muse AI 计划：预见未来而非迎合当下

Sonar 收购 AutoCodeRover，通过自主 AI 代理增强代码质量工具

AI 如何重塑数据中心：电力、制冷和基础设施挑战

2025年云计算与AI：塑造应用开发未来的五大趋势

AI 优化公有云服务商 Together AI 完成 3.05 亿美元融资

测试时扩展如何释放小型语言模型的隐藏推理能力 (并让它们超越大语言模型的表现)

微软新的 AI 代理可以控制软件和机器人

《网络数据安全管理条例》正式施行，企业数据保护合规如何落地？

博通创始人HENRY SAMUELI获得荣誉勋章

终端侧AI，如何从DeepSeek的连锁反应中受益？

谷歌将 Circle to Search 类似功能引入 iPhone 的 Google 和 Chrome 应用

KDE Plasma 6.3 发布，6.3.1 紧随其后

伊桑·莫利克：智能洪流的预言（译文）

SearchGPT 将如何影响制药和医疗保健行业？

驾驭混合智能的四种方式：激活你的资产

算法发现与痴呆症相关的常见睡眠障碍

生成式 AI 导致超大规模数据中心规模膨胀，研究显示

2025年值得关注的5大生成式AI趋势

AI 图像开发最佳实践指南

各大PC厂商在 CES 展会展示 AI 电脑新品

Cohere 推出基于 AI 大语言模型的 North 生产力平台

AI 如何提升电信行业的效率和价值

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

2024 AI创新者大会

智算“筑基”AI未来

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: