随着特斯拉计划本周在德克萨斯州奥斯汀推出配备安全驾驶员的试点无人驾驶出租车服务(特斯拉员工坐在副驾驶座位上进行监督和干预),现在是回顾安全驾驶员历史以及其他用于帮助自动驾驶汽车解决"长尾"问题的技术的好时机。
制造一辆能够完美安全地处理每种可能道路情况的汽车是一个科幻目标——没有人知道如何实现这一点。因此,所有无人驾驶汽车都以某种方式依赖人类,从清洁和充电等简单任务到在做出不安全行为时进行干预。
移除安全驾驶员是将车辆从测试原型变为真正无人驾驶出租车的"重大步骤"。虽然还有许多其他步骤,但与车辆首次在没有人类监督和控制的情况下上路相比,这些都是小步骤。
最早的无人驾驶汽车相当原始且经常失效,被设置为人类驾驶员可以坐在驾驶员座位上随时抓住方向盘或踩踏板。这会立即断开自动驾驶系统,汽车变为手动驾驶。许多汽车还配备"大红按钮",这是一个紧急停止按钮,在抓住控制装置失败时使用。
除了DARPA大挑战等封闭赛道外,从第一天开始,所有无人驾驶汽车测试都是这样工作的。所有团队都希望有一天能够移除安全驾驶员,因为这是整个目标。它通常工作得很好。有了行为恰当的安全驾驶员,测试无人驾驶汽车具有很好的安全记录。
在早期,汽车通常配备两名工作人员,一名在方向盘后面,另一名有时被称为软件操作员,监控驾驶软件以确保其正确运行。安全驾驶员可以随时接管方向盘,并被告知如果感觉到任何异常情况时要这样做。
特斯拉在发布Autopilot和FSD时将事情提升到了新的水平。这些系统让普通未经培训的客户充当车辆的监督员。当特斯拉这样做时,人们非常怀疑依赖普通客户是否不安全,但实际上,它成功了。
除了驾驶员座位,一些车辆将安全操作员放在其他位置,如副驾驶座位。在没有控制装置的车辆中(如某些班车),员工可能只能访问紧急停止按钮,该按钮命令车辆停止并靠边停车。
令人惊讶的是,今天道路上有远程驾驶的汽车。德国公司Vay使用这种技术在拉斯维加斯为客户送车。其他几家公司也为远程驾驶构建了不同的工具。
远程驾驶通过公共数据网络完成,当然面临中断、丢包和有时长延迟。因此,它通常配备能够在没有远程输入的情况下执行安全基本操作的系统,在最坏情况下,如果通信变得太糟糕,它只会停下来。
远程监督实际上是将安全驾驶员变为远程的。汽车主要自动驾驶,但远程监督员始终在观看(通常使用一组屏幕或可能是VR头戴设备),如果他们看到需要接管的情况,会虚拟地"抓住方向盘"。
大多数公司都有连接到汽车并观察其行为的能力,即使在完全自主模式下也是如此。虽然公司拒绝对此发表评论,但当他们首次敢于在没有安全驾驶员的情况下派出汽车时,所有公司可能都这样做了。
所有公司都倾向于拥有远程辅助操作室。在那里,操作员可以帮助车辆在遇到困惑时解决问题。他们通常不能直接驾驶车辆,只能给出战略建议,如"掉头并采用这条新路线"或"在第二个路口左转",最常见的是"继续你当前的计划,没问题"。
为了使远程辅助规模化,你需要道路上的车辆数量比远程辅助操作员多得多,这样每辆车平均只需要在很小一部分时间内进行主动辅助。
当其他一切都失败时,大多数团队可以派遣人类开车营救车辆,通过手动驾驶或在最坏情况下拖车。对于没有控制装置的汽车,这些团队将配备插入式视频游戏风格控制器。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。