作为"神经表达"设计改版的一部分,安卓版 Gemini Live 现已能够接入更多第一方及第三方"连接应用"。
本次更新使用户能够"在快速提问与深度自由对话之间无缝切换,始终保持流畅体验"。Gemini Live 通过全新的浮动界面直接集成到文本对话功能中。
在此之前,Gemini Live 仅支持与 Google 日历、任务、Keep 和地图进行整合,以及三星、荣耀、一加、OPPO、传音、vivo 和小米等品牌的同类第三方应用。
此次更新后,第一方应用列表新增了 Google Home、Hotels(酒店)、Flights(航班)、Workspace、图像生成、购物、实用工具、YouTube 以及 YouTube Music,同时还加入了对 Spotify 的支持。
上述服务列表与 gemini.google.com/apps 页面上展示的内容保持一致。值得一提的是,安卓端"实用工具"功能的接入解锁了计时器和闹钟功能。目前,Gemini Live 的功能已与 Gemini 应用(尤其是悬浮窗模式)基本持平。
不过,有一项功能仍未到位,那就是通过 Gemini Live 发送短信的能力。这一功能最早由谷歌在 2024 年"Made by Google"发布会上提及,目前尚未正式上线。
Q&A
Q1:Gemini Live 此次更新新增了哪些支持的应用?
A:本次更新后,Gemini Live 新增支持的第一方应用包括 Google Home、Hotels、Flights、Workspace、图像生成、购物、实用工具、YouTube 和 YouTube Music,同时还新增了第三方应用 Spotify 的支持。安卓端还通过"实用工具"解锁了计时器和闹钟功能。
Q2:Gemini Live 目前还有哪些功能尚未上线?
A:目前,通过 Gemini Live 发送短信的功能仍未正式上线。这一功能最早在 2024 年"Made by Google"发布会上被谷歌提及,但截至本次更新仍未实现。
Q3:Gemini Live 的浮动界面有什么作用?
A:Gemini Live 的新浮动界面将语音对话功能直接集成到文本聊天体验中,用户可以在快速文字提问与深度语音对话之间自由切换,无需中断当前操作,体验更加流畅连贯。
好文章,需要你的鼓励
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
作者对Chrome、Edge和Firefox三款主流浏览器的内置AI功能进行了实测对比。Chrome依托Gemini提供搜索摘要与提示词保存功能;Edge集成Copilot,可针对网页、PDF及多标签页进行问答;Firefox则支持多款AI聊天机器人,并提供更强的隐私保护。综合体验后,作者最终选择Edge作为AI辅助浏览的首选,但仍以Firefox作为默认浏览器。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。