谷歌正在向Android系统上的Gemini覆盖层推送更新,此次更新实质上为用户带来了类似"Circle to Search"的功能,让用户能够更精准地聚焦提示内容。
更新推送至用户设备后,激活Gemini覆盖层时将显示"圈出任意内容或询问关于此屏幕的问题"提示语。
用户完成圈选操作后,可以通过四色光晕周围的拖动控制点进一步调整选择区域。这一功能允许用户选取屏幕上的任意内容,并将其作为图片添加至提示中。点击覆盖层中的图片,还可以调用现有的绘图工具集。
与此同时,覆盖层的加号菜单中新增了"屏幕内容"选项,位于摄像头选项上方,方便用户手动将整个屏幕内容添加至提示。值得一提的是,Gemini此前已能在相关指令下自动识别屏幕内容,而此次新增的功能则让用户可以更精确地控制这一过程。
目前,上述功能已随Google应用最新稳定版本(17.20)广泛推送。如果您尚未看到该功能,可以尝试在应用信息中强制停止后重新启动。
Q&A
Q1:Gemini覆盖层的圈选功能和Circle to Search有什么区别?
A:两者功能类似,都支持在屏幕上圈选内容进行搜索或提问。Gemini覆盖层的新功能在此基础上还支持通过拖动控制点调整选区范围,并可将圈选内容作为图片直接添加至Gemini的提示中,结合AI进行更深入的交互,而不仅限于搜索。
Q2:Gemini覆盖层新增的"屏幕内容"选项有什么用?
A:新增的"屏幕内容"选项允许用户手动将整个屏幕内容添加至Gemini提示中。虽然Gemini此前已能在处理相关指令时自动识别屏幕内容,但新选项让用户可以主动、精确地控制是否将屏幕内容纳入提示,操作更加灵活。
Q3:如何在Android设备上获取Gemini覆盖层的圈选功能更新?
A:该功能随Google应用17.20稳定版本推送。如果已安装最新版本但仍未看到该功能,可以进入手机的应用信息页面,对Google应用执行"强制停止"操作,之后重新启动即可。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。