Gemini的任务自动化功能现已推出,Galaxy S26 Ultra是首批支持该功能的设备之一。
几周前,谷歌和三星宣布了一项重大的Gemini功能,即将登陆其最新设备:任务自动化。该功能首先从外卖和打车应用开始,Gemini能够代替用户在虚拟窗口中使用特定应用程序,处理点餐或预约机场接送等事务,这一切都只需简单的语音指令。这些正是我们多年来一直期待AI助手能够实现的功能。
当我首次开始测试S26 Ultra时,这项功能尚未上线,但刚刚作为系统更新的一部分以测试版形式推出。看着自己的手机自主操作,真是一种奇妙的体验!
我给出的第一个指令很简单:预约优步去机场。Gemini询问了具体哪个机场(这是个很好的问题!),然后自主完成了几个步骤:添加目的地,并选择跳过指定航空公司的步骤,因为我当地机场都在同一个航站楼,所以这个步骤并不重要。正如承诺的那样,系统在最后一步前暂停,提示我在提交叫车请求前检查详细信息。
用户可以选择观看Gemini执行各个步骤,并且随时可以接管控制权或停止自动化操作。
一个更模糊且稍微复杂的请求——订购咖啡和羊角包——需要我提供更多输入信息,Gemini花费了大量时间浏览星巴克的热饮选项,但最终确实在菜单上找到了平白咖啡。它还面临一个关键决定:羊角包是要加热的巧克力羊角包,还是直接从糕点柜取出的?在没有我输入的情况下,它正确地指定糕点应该加热。对于一个一年前还会就我日历上的航班细节与我争论的助手来说,这确实令人印象深刻。
我还需要对这个自动化功能进行更多测试,计划在接下来的几天里给它一些挑战。不过,看到这项功能在实际应用中按预期工作,确实令人印象深刻——至少到目前为止是这样的。
Q&A
Q1:Gemini的任务自动化功能具体能做什么?
A:Gemini能够代替用户在虚拟窗口中使用特定应用程序,处理外卖订餐、打车预约等任务,用户只需给出简单的语音指令即可。目前主要支持外卖和打车应用,未来会扩展到更多应用。
Q2:使用Gemini自动化时能否中途控制?
A:是的,用户可以选择观看Gemini执行各个步骤的过程,并且随时可以接管控制权或停止自动化操作。系统会在关键步骤(如最终确认)前暂停,让用户检查详细信息。
Q3:哪些设备支持Gemini的任务自动化功能?
A:Galaxy S26 Ultra是首批支持该功能的设备之一。该功能目前以测试版形式通过系统更新推出,是谷歌和三星合作开发的最新Gemini功能。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。