近两年前,Motional正处于自动驾驶汽车发展的十字路口。
这家由现代汽车集团和安波福40亿美元合资成立的公司,已经错过了与合作伙伴Lyft推出无人驾驶出租车服务的最后期限。安波福退出了对该公司的财务支持,促使现代汽车再次投资10亿美元以维持公司运营。几次裁员,包括2024年5月40%的重组裁员,使公司员工从峰值约1400人减少到不足600人。与此同时,AI技术的进步正在改变工程师开发技术的方式。
Motional面临着要么进化要么死亡的选择,该公司暂停了所有项目并选择了第一个选项。
Motional告诉TechCrunch,该公司已经采用AI优先的方法重启了无人驾驶出租车计划,并承诺到2026年底在拉斯维加斯推出商业无人驾驶服务。该公司已经为员工开放了无人驾驶出租车服务,不过仍有人类安全操作员在驾驶座后方待命。公司计划今年晚些时候与一家未透露名称的网约车合作伙伴向公众提供该服务(Motional与Lyft和Uber都有现有的合作关系)。公司表示,到年底,人类安全操作员将从无人驾驶出租车中撤离,真正的商业无人驾驶服务将开始。
Motional总裁兼首席执行官Laura Major在公司拉斯维加斯设施的演示中表示:"我们看到了AI领域所有进步带来的巨大潜力;我们也看到虽然我们有一个安全的无人驾驶系统,但在获得可负担、可泛化并能在全球范围内扩展的解决方案方面还存在差距。因此,我们做出了暂停商业活动这一艰难决定,在短期内放慢脚步,以便我们能够加速发展。"
这意味着从传统机器人技术方法转向基于AI基础模型的方法。Motional从未完全缺乏AI技术。该公司的自动驾驶系统使用单独的机器学习模型来处理感知、跟踪和语义推理。但它也在软件栈的其他操作中使用了更多基于规则的程序。Major表示,这些单独的机器学习模型使其成为一个复杂的软件网络。
与此同时,最初为语言构建的AI模型开始应用于机器人和其他物理AI系统,包括自动驾驶的开发。Transformer架构使构建大型复杂的AI模型成为可能,最终导致了ChatGPT的出现和使用量的急剧增长。
Motional寻找方法将这些较小的模型结合起来,并将它们集成到单一主干中,实现端到端架构。公司还为开发人员保留了较小的模型,Major解释说这给Motional带来了两全其美的效果。
"这对两个方面都非常关键:一是更容易泛化到新城市、新环境、新场景,二是以成本优化的方式做到这一点。例如,你去的下一个城市的交通灯可能不同,但你不必重新开发或重新分析这些。你只需收集一些数据,训练模型,它就能够在那个新城市安全运行。"
TechCrunch在拉斯维加斯进行了30分钟的自动驾驶体验,亲身了解了Motional的新方法。一次演示无法提供对自动驾驶系统的准确评估,但它可以指出弱点和与以前版本的差异,并衡量进展。
我看到的就是进展,当我乘坐的现代Ioniq 5自动驾驶离开拉斯维加斯大道,进入Aria酒店的接送区域时。这些繁忙的区域在拉斯维加斯臭名昭著,我的体验也不例外,自动驾驶汽车慢慢绕过停止的出租车和正在下客的乘客,变道,然后再变回来,沿途经过数十人、巨大的花盆和汽车。
Motional此前与合作伙伴Lyft在拉斯维加斯运营网约车服务,使用的车辆可以自动处理行程的部分路段。停车场和酒店代客泊车以及应用打车接载区域从未包含在这些操作中。始终坐在驾驶座后方的人类安全操作员会接管导航停车场或酒店大堂繁忙的接送点。
仍有更多进展有待取得。向乘客显示的车内图形仍在开发中。虽然在我的演示行程中从未出现脱离接管情况(即人类安全操作员接管),但车辆在绕过双重停放的亚马逊送货车时确实花了一些时间。
尽管如此,Major认为Motional正在走向安全且经济高效部署的正确道路。她说,大股东现代汽车将长期投入其中。
Major表示:"我认为所有这些的真正长期愿景是在人们的个人汽车上实现L4级自动驾驶,"她指的是系统处理所有驾驶且无需人类干预的术语。"无人驾驶出租车是第一站,影响巨大。但最终,我认为任何汽车制造商都希望将其集成到他们的汽车中。"
Q&A
Q1:Motional为什么要重启无人驾驶出租车计划?
A:Motional面临多重挑战,包括错过与Lyft的服务推出期限、失去安波福的财务支持、多次裁员以及AI技术的快速发展改变了技术开发方式。公司选择暂停商业活动,采用AI优先的方法来重新构建更具泛化能力和成本效益的解决方案。
Q2:Motional的新AI方法与之前有什么不同?
A:之前Motional使用单独的机器学习模型处理感知、跟踪和语义推理,加上基于规则的程序,形成复杂的软件网络。新方法将这些模型整合到单一主干中,实现端到端架构,同时保留小型模型供开发使用,使系统更容易泛化到新环境且更具成本效益。
Q3:Motional计划何时推出真正的无人驾驶服务?
A:Motional计划到2026年底在拉斯维加斯推出商业无人驾驶服务。目前已为员工开放有安全操作员的服务,今年晚些时候将向公众开放,年底前移除安全操作员,开始真正的商业无人驾驶服务。
好文章,需要你的鼓励
人工智能开发商Anthropic为其旗舰聊天机器人Claude推出新的医疗健康功能,用户现在可以与服务共享医疗记录以更好地了解自己的健康状况。Claude可以连接官方医疗记录和苹果健康等健身应用,进行更个性化的健康对话。新功能现已向美国的Claude Pro和Max订阅用户开放。公司强调该工具不用于诊断或治疗建议,而是帮助用户理解复杂医疗报告,为医患沟通做准备,并承诺严格保护用户隐私数据。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
谷歌发布通用商务协议(UCP)开放商务标准,旨在让AI智能体自动化整个购物流程,从产品发现到支付再到售后服务。该协议与Shopify、Target、沃尔玛等零售商合作开发,支持AI智能体协同处理客户购买流程各环节。谷歌还推出品牌商业智能体和直接优惠工具,优化AI搜索中的购物体验。麦肯锡预测智能体商务到2030年将成长为3万亿美元市场。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。