谷歌去年底对Google Home进行了大规模AI驱动的改版,此后持续添加新功能。近日,谷歌宣布了一次较大规模的更新,可能将解决不少智能家居用户长期以来的痛点。摄像头画面导航将更加便捷,AI事件标注也会更加清晰明了。此外,Home语音助手升级至Gemini 3.1后,响应将更加准确可靠。
语音助手升级至Gemini 3.1
据谷歌介绍,已加入早期体验渠道的Home用户应已收到Gemini 3.1的更新。该AI模型于今年2月率先在其他平台发布,但彼时并未覆盖谷歌智能音箱。此次扩展至Home后,谷歌表示这些音箱将能够借助Gemini 3.1的"高级推理能力,更好地理解和执行复杂的多步骤语音指令"。当然,谷歌在每次Gemini更新时都会有类似的表述。
谷歌援引多项AI评测结果,证明Gemini 3.1在处理复杂提示方面表现更优。在ARC-AGI-2和Humanity's Last Exam等测试中均有所提升,这类测试涉及需要特定领域知识的逻辑推理题目。这种能力究竟能在主打简短交互的智能音箱上发挥多大价值,目前尚不明朗。不过,如有需要,用户依然可以与智能家居设备中的Gemini进行长对话。谷歌还指出,升级后的模型可在单条指令中同时处理多项任务,无需将任务拆分成多个指令分别下达。
此外,AI驱动的"Ask Home"功能也将随本次更新突破应用端限制。不久后,专属于Home的Gemini聊天机器人将在Home网页端上线,让用户可以通过对话方式查看摄像头历史记录并创建自动化规则,初期将以预览功能形式开放。
自动化选项同步扩充
谷歌还新增了多项自动化选项,涵盖触发条件和执行动作两个维度,具体如下:
安全与门禁控制:布防与撤防(控制安防系统状态及检查是否已布防);门锁监控(检测上锁、未锁、卡死、强制打开或虚掩等具体状态);二元传感器(检测接触或无接触、漏水或无漏水、冻结或未冻结等简单状态)。
家电与清洁:家电状态控制(对洗衣机、烘干机、咖啡机等设备执行启动、停止、暂停、继续等操作);扫地机器人(支持回充座、暂停或继续清扫等专属指令)。
照明与环境控制:灯光控制(调节亮度、开关切换及管理灯光效果);彩色灯光(更改灯泡、LED灯带等设备的颜色或色温);窗帘控制(开关百叶窗或查看其开合百分比);气候监控(通过温控器监测相对湿度)。
媒体与娱乐:播放控制(监测播放、暂停或缓冲等状态);音量管理(查看及控制媒体设备的音量)。
设备状态与输入:电源管理(监测电池电量和充电状态);智能开关事件(支持单次按压、长按及释放等输入事件)。
付费用户可通过Ask Home创建自动化规则(支持新增的触发条件),普通用户则仍可通过按钮和下拉菜单以传统方式进行设置。
摄像头体验优化
2025年版Home应用带来了大量改动,但摄像头体验仍有不足——操控依然繁琐,AI通知也不够实用,甚至时有误判。本次更新有望解决其中部分问题,但谷歌表示底层模型并未升级至Gemini 3.1,该升级仅限于语音助手端。
时间轴导航方面,谷歌表示将大幅改善拖动回放时的帧率,使用户更容易定位目标时间点。即便错过,现在也新增了简洁的跳转按钮,可前进或后退10秒。此外还新增了滑动手势,用于切换时间轴与事件视图,以及调整播放器窗口大小。
在人脸识别方面,自从迁移至Gemini后,Google Home的人物识别能力有所下滑,导致通知实用性大打折扣。为此,Home新增了点赞与点踩的反馈按钮,帮助"熟悉面孔"通知随时间推移变得更加准确。人脸识别功能也将自动过滤模糊或被遮挡的图像,以提升识别精度。此外,通知和时间轴预览将生成更优质的动态预览GIF,且画面将以主体为中心。
在事件标注方面,Google Home分析摄像头画面的AI模型此前存在误判问题,曾出现将室内情况标注为"有鹿"之类的错误通知。谷歌虽未宣称描述质量有重大改进,但表示系统已经过精简优化,生成的描述将更简洁,事件标签将"更加准确",减少信息冗余。最终效果如何,仍有待观察。
需要注意的是,免费版Home用户无法使用Ask Home和AI事件描述功能。但订阅了延长录像存储服务的付费用户,将在更多场景下看到AI生成的简化描述,包括时间轴视图,以及此前不支持Gemini的旧款Nest摄像头。不过,用户需要在摄像头设置中确认已开启Gemini for Home相关功能。
Q&A
Q1:Gemini 3.1升级对Google Home智能音箱有什么实际改变?
A:升级至Gemini 3.1后,Google Home智能音箱具备更强的推理能力,能更好地理解并执行复杂的多步骤语音指令,还支持在单条指令中同时处理多项任务,不必将任务拆分成多条指令分别说。目前已加入早期体验渠道的用户应已收到此次更新。
Q2:Google Home摄像头的时间轴导航做了哪些改进?
A:本次更新后,拖动回放时的帧率明显提升,定位目标时间点更加流畅。同时新增了前进或后退10秒的快捷跳转按钮,以及用于切换时间轴与事件视图的滑动手势,还支持调整播放器窗口大小,整体操控体验更加顺手。
Q3:Google Home的人脸识别功能为什么不准,新版本有什么改善?
A:迁移至Gemini后,Google Home的人物识别能力有所下滑。新版本新增了点赞与点踩反馈按钮,用户的反馈将帮助"熟悉面孔"通知随时间变得更准确。此外,系统现在会自动过滤模糊或被遮挡的图像,避免因图像质量差导致误识别,通知预览的GIF也将以人物主体为中心展示。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。