随着特斯拉计划本周在德克萨斯州奥斯汀推出配备安全驾驶员的试点无人驾驶出租车服务(特斯拉员工坐在副驾驶座位上进行监督和干预),现在是回顾安全驾驶员历史以及其他用于帮助自动驾驶汽车解决"长尾"问题的技术的好时机。
制造一辆能够完美安全地处理每种可能道路情况的汽车是一个科幻目标——没有人知道如何实现这一点。因此,所有无人驾驶汽车都以某种方式依赖人类,从清洁和充电等简单任务到在做出不安全行为时进行干预。
移除安全驾驶员是将车辆从测试原型变为真正无人驾驶出租车的"重大步骤"。虽然还有许多其他步骤,但与车辆首次在没有人类监督和控制的情况下上路相比,这些都是小步骤。
最早的无人驾驶汽车相当原始且经常失效,被设置为人类驾驶员可以坐在驾驶员座位上随时抓住方向盘或踩踏板。这会立即断开自动驾驶系统,汽车变为手动驾驶。许多汽车还配备"大红按钮",这是一个紧急停止按钮,在抓住控制装置失败时使用。
除了DARPA大挑战等封闭赛道外,从第一天开始,所有无人驾驶汽车测试都是这样工作的。所有团队都希望有一天能够移除安全驾驶员,因为这是整个目标。它通常工作得很好。有了行为恰当的安全驾驶员,测试无人驾驶汽车具有很好的安全记录。
在早期,汽车通常配备两名工作人员,一名在方向盘后面,另一名有时被称为软件操作员,监控驾驶软件以确保其正确运行。安全驾驶员可以随时接管方向盘,并被告知如果感觉到任何异常情况时要这样做。
特斯拉在发布Autopilot和FSD时将事情提升到了新的水平。这些系统让普通未经培训的客户充当车辆的监督员。当特斯拉这样做时,人们非常怀疑依赖普通客户是否不安全,但实际上,它成功了。
除了驾驶员座位,一些车辆将安全操作员放在其他位置,如副驾驶座位。在没有控制装置的车辆中(如某些班车),员工可能只能访问紧急停止按钮,该按钮命令车辆停止并靠边停车。
令人惊讶的是,今天道路上有远程驾驶的汽车。德国公司Vay使用这种技术在拉斯维加斯为客户送车。其他几家公司也为远程驾驶构建了不同的工具。
远程驾驶通过公共数据网络完成,当然面临中断、丢包和有时长延迟。因此,它通常配备能够在没有远程输入的情况下执行安全基本操作的系统,在最坏情况下,如果通信变得太糟糕,它只会停下来。
远程监督实际上是将安全驾驶员变为远程的。汽车主要自动驾驶,但远程监督员始终在观看(通常使用一组屏幕或可能是VR头戴设备),如果他们看到需要接管的情况,会虚拟地"抓住方向盘"。
大多数公司都有连接到汽车并观察其行为的能力,即使在完全自主模式下也是如此。虽然公司拒绝对此发表评论,但当他们首次敢于在没有安全驾驶员的情况下派出汽车时,所有公司可能都这样做了。
所有公司都倾向于拥有远程辅助操作室。在那里,操作员可以帮助车辆在遇到困惑时解决问题。他们通常不能直接驾驶车辆,只能给出战略建议,如"掉头并采用这条新路线"或"在第二个路口左转",最常见的是"继续你当前的计划,没问题"。
为了使远程辅助规模化,你需要道路上的车辆数量比远程辅助操作员多得多,这样每辆车平均只需要在很小一部分时间内进行主动辅助。
当其他一切都失败时,大多数团队可以派遣人类开车营救车辆,通过手动驾驶或在最坏情况下拖车。对于没有控制装置的汽车,这些团队将配备插入式视频游戏风格控制器。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。