随着特斯拉计划本周在德克萨斯州奥斯汀推出配备安全驾驶员的试点无人驾驶出租车服务(特斯拉员工坐在副驾驶座位上进行监督和干预),现在是回顾安全驾驶员历史以及其他用于帮助自动驾驶汽车解决"长尾"问题的技术的好时机。
制造一辆能够完美安全地处理每种可能道路情况的汽车是一个科幻目标——没有人知道如何实现这一点。因此,所有无人驾驶汽车都以某种方式依赖人类,从清洁和充电等简单任务到在做出不安全行为时进行干预。
移除安全驾驶员是将车辆从测试原型变为真正无人驾驶出租车的"重大步骤"。虽然还有许多其他步骤,但与车辆首次在没有人类监督和控制的情况下上路相比,这些都是小步骤。
最早的无人驾驶汽车相当原始且经常失效,被设置为人类驾驶员可以坐在驾驶员座位上随时抓住方向盘或踩踏板。这会立即断开自动驾驶系统,汽车变为手动驾驶。许多汽车还配备"大红按钮",这是一个紧急停止按钮,在抓住控制装置失败时使用。
除了DARPA大挑战等封闭赛道外,从第一天开始,所有无人驾驶汽车测试都是这样工作的。所有团队都希望有一天能够移除安全驾驶员,因为这是整个目标。它通常工作得很好。有了行为恰当的安全驾驶员,测试无人驾驶汽车具有很好的安全记录。
在早期,汽车通常配备两名工作人员,一名在方向盘后面,另一名有时被称为软件操作员,监控驾驶软件以确保其正确运行。安全驾驶员可以随时接管方向盘,并被告知如果感觉到任何异常情况时要这样做。
特斯拉在发布Autopilot和FSD时将事情提升到了新的水平。这些系统让普通未经培训的客户充当车辆的监督员。当特斯拉这样做时,人们非常怀疑依赖普通客户是否不安全,但实际上,它成功了。
除了驾驶员座位,一些车辆将安全操作员放在其他位置,如副驾驶座位。在没有控制装置的车辆中(如某些班车),员工可能只能访问紧急停止按钮,该按钮命令车辆停止并靠边停车。
令人惊讶的是,今天道路上有远程驾驶的汽车。德国公司Vay使用这种技术在拉斯维加斯为客户送车。其他几家公司也为远程驾驶构建了不同的工具。
远程驾驶通过公共数据网络完成,当然面临中断、丢包和有时长延迟。因此,它通常配备能够在没有远程输入的情况下执行安全基本操作的系统,在最坏情况下,如果通信变得太糟糕,它只会停下来。
远程监督实际上是将安全驾驶员变为远程的。汽车主要自动驾驶,但远程监督员始终在观看(通常使用一组屏幕或可能是VR头戴设备),如果他们看到需要接管的情况,会虚拟地"抓住方向盘"。
大多数公司都有连接到汽车并观察其行为的能力,即使在完全自主模式下也是如此。虽然公司拒绝对此发表评论,但当他们首次敢于在没有安全驾驶员的情况下派出汽车时,所有公司可能都这样做了。
所有公司都倾向于拥有远程辅助操作室。在那里,操作员可以帮助车辆在遇到困惑时解决问题。他们通常不能直接驾驶车辆,只能给出战略建议,如"掉头并采用这条新路线"或"在第二个路口左转",最常见的是"继续你当前的计划,没问题"。
为了使远程辅助规模化,你需要道路上的车辆数量比远程辅助操作员多得多,这样每辆车平均只需要在很小一部分时间内进行主动辅助。
当其他一切都失败时,大多数团队可以派遣人类开车营救车辆,通过手动驾驶或在最坏情况下拖车。对于没有控制装置的汽车,这些团队将配备插入式视频游戏风格控制器。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。