Google 已开始向 Gemini Live 推出新的 AI 功能,让它能够"看到"你的屏幕或通过智能手机摄像头进行实时问答,Google 发言人 Alex Joseph 在发给 The Verge 的邮件中确认了这一消息。这些功能的推出距离 Google 首次展示支持这些功能的"Project Astra"项目已近一年。
据 9to5Google 报道,一位 Reddit 用户表示该功能出现在他们的小米手机上。今天,这位用户发布了一段视频,展示了 Gemini 新的屏幕阅读能力。这是 Google 在三月初宣布的两项功能之一,当时表示这些功能"将作为 Google One AI Premium 计划的一部分,在本月晚些时候向 Gemini Advanced 订阅用户开放"。
目前正在推出的另一项 Astra 功能是实时视频,它允许 Gemini 实时解读智能手机摄像头的画面并回答相关问题。在 Google 本月发布的演示视频中,一个人使用该功能请求 Gemini 帮助决定为新上釉的陶器选择什么颜色的涂料。
Google 推出这些功能的时机恰逢其在 AI 助手领域保持领先优势之际,此时 Amazon 正准备有限度地推出 Alexa Plus 升级版的早期访问,而 Apple 则推迟了其升级版 Siri 的发布。这两款产品都应该具有类似于 Astra 现在开始启用的功能。与此同时,虽然 Samsung 仍然拥有 Bixby,但 Gemini 依然是其手机上的默认助手。
好文章,需要你的鼓励
谷歌在I/O开发者大会上发布"通用购物车"功能,基于通用商务协议(UCP)整合YouTube、Gmail、Gemini等平台的购物数据,支持Target、Shopify、Wayfair等主流零售商。AI代理可自动检测商品兼容性、推荐优惠信用卡、比价提醒,并在用户授权下自动完成日常采购。该功能旨在打通"加入购物车"到"完成结账"的全流程,实现个性化、无摩擦的购物体验。
这项联合研究提出了COVER方法和CM-EVS数据集,用贪心算法从3D场景中智能筛选全景视角,每场景仅需25帧即可完整覆盖室内场景,并附完整溯源日志。
HolderPO通过引入可调参数p的霍尔德均值替代固定的算术平均,解决了大模型推理训练中信号放大与稳定性之间的根本矛盾,配合动态退火策略在数学推理和代理任务上均创造了新的最优记录。