根据研究员Jane Manchun Wong的发现,Waymo似乎正在测试将谷歌的Gemini AI聊天机器人添加到其无人驾驶出租车中,以集成一个可以陪伴乘客并回答他们询问的AI助手。
"在深入研究Waymo的移动应用代码时,我发现了其尚未发布的Gemini集成的完整系统提示,"Wong在博客中写道。"这份文档内部标题为'Waymo乘车助手元提示',是一个超过1200行的规范,明确定义了AI助手在Waymo车辆内的预期行为。"
该功能尚未在公共版本中发布,但Wong表示系统提示清楚表明这"不仅仅是一个简单的聊天机器人"。据说该助手具有回答问题、管理某些车内功能(如空调控制)以及在需要时安慰乘客的能力。
"虽然我们今天没有详细信息可以分享,但我们的团队总是在研究各种功能,以使乘坐Waymo变得愉悦、流畅和有用,"Waymo发言人Julia Ilina告诉TechCrunch。"其中一些功能可能会或可能不会进入我们的乘客体验。"
这不是Gemini首次被集成到这家Alphabet旗下的自动驾驶公司的技术栈中。Waymo表示,它已经使用Gemini的"世界知识"来训练其自动驾驶车辆导航复杂、罕见和高风险的场景。
Wong写道,助手被指示具有明确的身份和目的:"一个友好且有用的AI伴侣,集成到Waymo自动驾驶车辆中",其主要目标是"通过以安全、令人安心和不突兀的方式提供有用信息和帮助来增强乘客体验"。机器人被指导使用清晰、简单的语言,避免技术术语,并被指示将回复简洁地控制在一到三句话内。
根据系统提示,当乘客通过车内屏幕激活助手时,Gemini可以从一组预先批准的问候语中选择,并使用乘客的名字进行个性化设置。系统还可以访问关于乘客的上下文数据,比如他们乘坐了多少次Waymo。
提示目前允许Gemini访问和控制车内功能,如温度、照明和音乐。Wong指出,功能列表中明显缺少音量控制、路线更改、座椅调节和车窗控制。如果乘客要求Gemini无法控制的功能,机器人应该用"期待性短语"回复,如"这还不是我现在能做的事情"。
有趣的是,助手被指示在其作为Gemini AI机器人的身份和自动驾驶技术(Waymo司机)之间保持明确的区别。因此,当回答诸如"你是如何看路的?"这样的问题时,Gemini不应该说"我使用传感器组合",而应该回复"Waymo司机使用传感器组合..."
系统提示包含一系列引人注目的细节,例如机器人如何处理关于特斯拉或现已停运的Cruise等竞争对手的问题,或者哪些触发关键词会让它停止说话。
助手还被指示避免推测、解释、确认、否认或评论实时驾驶行为或特定驾驶事件。因此,如果乘客询问他们看到的Waymo撞击某物的视频,机器人被指示不要直接回答而是转移话题。
"你的角色不是成为驾驶系统性能的发言人,你不得采用防御性或道歉的语调,"提示中写道。
车载助手被允许回答一般知识问题,如天气、埃菲尔铁塔的高度、当地Trader Joe's的关门时间以及谁赢得了上届世界大赛。它不被允许采取现实世界的行动,如订餐、预订或处理紧急情况。
Waymo不是唯一一家将AI助手集成到无人驾驶车辆中的公司。特斯拉也在使用xAI的Grok做类似的事情。然而,这两种不同的汽车助手服务于不同的功能。Gemini似乎被编程为更加务实和专注于乘车体验,而Grok更多被定位为可以处理长时间对话并记住之前问题上下文的车内伙伴。
Q&A
Q1:Waymo的Gemini AI助手主要能做什么?
A:Waymo的Gemini AI助手可以回答乘客问题、管理车内功能如温度和照明控制、提供一般知识信息,并在需要时安慰乘客,旨在以安全、令人安心的方式增强乘客的乘车体验。
Q2:Waymo的AI助手与特斯拉的Grok有什么区别?
A:Waymo的Gemini助手更加务实和专注于乘车体验,主要处理车内功能和基本问答;而特斯拉的Grok更像是车内伙伴,可以处理长时间对话并记住之前问题的上下文。
Q3:Waymo的Gemini助手有哪些限制?
A:该助手不能控制音量、更改路线、调节座椅或控制车窗,不能采取现实世界行动如订餐或处理紧急情况,也被禁止评论实时驾驶行为或特定驾驶事件。
好文章,需要你的鼓励
近年来,AI学会了写作、生成图像、创建视频甚至编写代码。随着这些能力成为主流,研究重点转向更深层问题:机器能否真正理解世界运作方式?世界模型应运而生,从1950年代概念到2024年OpenAI的Sora、2025年英伟达Cosmos等突破性应用。与语言模型基于文本预测不同,世界模型专注预测环境变化,通过学习因果关系实现推理规划。在机器人、自动驾驶等物理AI领域前景广阔,但面临计算资源需求高、数据收集困难等挑战。
印度统计学院研究团队对14个大语言模型进行三段论推理测试,发现AI存在"双重人格"现象:顶级模型在逻辑推理上近乎完美(99.6%),但常识判断仅达随机水平(52%)。研究揭示了AI与人类推理的根本差异——AI正成为纯逻辑机器,而非具备常识的智能体,为AI发展方向提出深层思考。
CIO角色正经历前所未有的转型。技术领导者不再仅专注于数字化转型和云迁移,还将承担企业可持续发展、AI治理和战略平台整合等责任。AI将从部署工具转变为重塑企业对技术领导者期望的核心力量。2026年CIO将承担负责任AI治理、推动AI驱动的平台整合、从IT转向企业级创新,以及成为可持续发展的首要管理者四大新职能。
DataFlow是北京大学等机构开发的AI数据准备统一框架,通过近200个可复用算子和智能助手DataFlow-Agent,将传统手工数据处理升级为标准化流水线。实验证明其数据质量显著提升模型性能,在数学推理、代码生成、数据库查询等任务中均取得突破性改进,仅1万样本效果可媲美百万级传统数据集。