我们离手机"自动驾驶"又近了一步。
又到了Gemini的高光时刻。谷歌在其I/O大会前的Android专题展示中,发布了一系列Gemini新功能,其中许多旨在帮助用户操控手机。Gemini将出现在更多地方,比如Android版Chrome、自动填充建议中,以及各类应用内——只要你愿意开启。
谷歌还为我们带来了一个新名称——Gemini Intelligence。据谷歌Android体验总监本·格林伍德介绍,该功能"将Gemini最出色的能力带到我们最先进的Android设备上"。谷歌将部分现有功能和新功能整合在这一品牌之下,并似乎将其定位为Galaxy S26系列等高端Android手机的专属体验。这一点,不妨先记在你的I/O宾果卡上。
任务自动化是"Gemini最佳功能"之一。目前该功能已在部分较新的Pixel和三星Galaxy手机上推出,可让Gemini代替用户操作特定应用。此前,这一功能仅支持少数叫车和外卖应用。据谷歌透露,"近期"任务自动化将扩展至更广泛的应用范围。
此外,任务自动化还将新增多模态支持。此前,Gemini仅能通过语音或文字提示来执行操作。现在,你还可以加入截图或照片。比如,你可以把备忘录应用里的购物清单截图发给Gemini,它会自动将这些商品添加到你的购物车——前提是你的Android手机支持Gemini Intelligence功能。
Gemini Intelligence旗下还有一项全新功能——"创建我的小组件"(Create My Widget)。谷歌在博客中将其定位为迈向"生成式UI"的第一步,用户只需用自然语言描述想要的功能,AI便会自动生成一个定制化小组件。谷歌给出的示例包括:为骑行爱好者打造一个一眼即可查看风速和降水量的天气小组件,以及一个可以定期推送特定食谱建议的面板,比如"每周三款高蛋白备餐食谱"。这些小组件还将同步支持Wear OS,因此在智能手表上也能使用。
乍一看这似乎是个简单的想法,但如果你把小组件理解为可以直接"氛围编程"到手机主屏幕上的迷你应用,它就显得更有意思了。也许这真的是迈向"界面自动生成"的一小步,也可能是对一个小小组件功能寄予了太多期待。无论如何,我很期待在I/O主题演讲中听到更多关于"生成式UI"的内容。
谷歌还将桌面版Chrome中已有的Gemini功能引入Android应用。这意味着你将在Chrome中看到一个Gemini按钮,可以分享网页内容,并直接在浏览器内向Gemini提问。如果你订阅了谷歌AI Pro或Ultra计划,还将获得自动浏览功能,帮助你完成预约等任务。该功能将于6月下旬开始推出。
Gemini还将出现在Android的自动填充功能中——当然,这是可选的。你可以选择接入Gemini来帮助填写表单,Gemini可借助其个人智能功能,访问你的Google相册和Gmail等信息,自动查找所需内容。理论上,这意味着Gemini可以从相册中提取你的车牌号等信息。实用?还是有点细思极恐?也许两者兼而有之?这就是Gemini季的魅力所在。格林伍德表示,Gemini Intelligence的各项功能将"在今年内分批推出",Galaxy和Pixel手机将率先于今夏开始获得更新。
Q&A
Q1:Gemini Intelligence是什么?和普通Gemini有什么区别?
A:Gemini Intelligence是谷歌推出的一个功能品牌,将Gemini最先进的能力整合在一起,专为高端Android设备打造,比如三星Galaxy S26系列和Pixel手机。与普通Gemini相比,它包含任务自动化、创建自定义小组件、多模态支持等更强大的功能,并不是所有Android设备都能使用,而是优先向旗舰机型推送。
Q2:Gemini任务自动化功能具体能做什么?
A:Gemini任务自动化功能可以代替用户在手机上操作特定应用,目前已支持叫车和外卖类应用,近期将扩展至更多应用类型。新版本还新增了多模态支持,用户可以将截图或照片作为指令输入,例如把购物清单截图发给Gemini,它会自动将商品添加到购物车,无需手动操作。
Q3:"创建我的小组件"功能怎么用?支持哪些设备?
A:用户只需用自然语言描述想要的小组件功能,AI就会自动生成一个定制化小组件并放置在主屏幕上。例如可以创建专为骑行者设计的天气小组件,或每周推送特定食谱的面板。该功能不仅支持Android手机,还兼容Wear OS智能手表。目前该功能属于Gemini Intelligence的一部分,将优先向高端Android设备推送。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。