在AI竞赛发展到当前阶段,大多数AI实验室已经意识到,真正的商业价值在于企业级应用场景——那些能够深刻改变大型公司运营方式的大型智能体功能。谷歌也是其中之一,这或许可以解释为什么该公司在周二Google I/O大会上发布的诸多面向消费者的AI功能,看起来有些……差强人意。
不仅如此,这些功能在已经层次繁多的Gemini生态体系中,显得零散而缺乏整合。这届I/O本应是谷歌让日常AI真正打动用户的机会,尤其是那些对公司大力推广AI持观望态度的用户。然而,尽管这些新功能确实提供了一些便利,谷歌的产品包装方式却可能反而削弱了它们的实用性与用户认知度。
Google Workspace在I/O上发布了几项新AI能力,其中最主要的是Docs Live和Gmail Live。没错,这两者实际上是同一套功能逻辑。
就像Gemini Live允许用户通过语音与Gemini交互一样,Docs Live和Gmail Live也让用户可以通过语音操控对应的应用。
在演示环节,谷歌员工用Docs Live在手机上生成了一份谷歌文档,内容来源于她当场口述的零散笔记、演示文稿及其他背景信息。Gmail Live的演示则展示了用户向Gmail提问,例如"这周学校有什么安排?"Gmail Live扫描收件箱后回复说有一次需要准备的实地考察活动。
这两项功能在处理更复杂的后续追问时,包括涉及日程冲突或话题切换时,表现尚可,也能区分"实地考察"和"底特律之旅"这类相近措辞。但本质上,这不过是Gemini Live的功能延伸,只是适配了新的应用场景。那为什么要给它们取不同的名字,再分别限定到各自的平台中?为什么不直接扩展Gemini Live的集成范围呢?
现场谷歌的代表没有一位能回答这个问题。
这种做法有些奇怪,毕竟到目前为止,谷歌的一贯策略是把Gemini嵌入到所有产品中。不管你喜不喜欢,这至少是一种清晰、有品牌凝聚力的方式,让用户只需记住一个入口就能享受到各种便利的AI功能(前提是功能能正常运行)。况且Workspace中的Gemini已经为Gmail、Docs和Sheets提供了各类能力,为何不把这些新功能也纳入这个统一框架下?
通过将功能相近的模块拆分为独立产品,谷歌反而可能让它最需要打动的那类用户——那些对AI持观望态度、不确定它是否与自己相关的长期谷歌用户——感到困惑甚至疲倦。相比列出一长串各自独立的产品名称,告诉用户"Gemini可以通过语音从多个应用中为你汇总信息",显然更容易被接受。
谷歌并非唯一一家这样做的公司:微软将Copilot嵌入了大多数现有产品,导致用户要在Copilot Chat、Microsoft 365 Copilot等名称之间反复辨别。OpenAI推出ChatGPT Apps时也面临类似的误解风险——它实际上只是ChatGPT与其他应用的集成功能,并非一个新产品或应用创建平台,但这个名称容易让人产生错误联想。
此外,Docs Live和Gmail Live目前向AI Pro订阅用户(月费20美元)和Ultra订阅用户(月费至少100美元)开放,今年夏天将对Workspace企业用户进入预览阶段,至于是否会最终向所有用户普及或并入Gemini本身,目前尚不明确。
对于独立上线的功能而言,这些应用场景相当小众,更何况还要单独收费。两项功能目前看起来只在移动端提供,定位在于让用户"随时随地"处理任务更加流畅。
Daily Brief是从去年底一个名为CC的实验性项目演变而来的新功能,它会从用户的邮件、日历及其他关联应用中汇总信息,生成当天的日程概览。对于担心AI"幻觉"的用户,它还提供了每条议程的来源链接,方便核实。
我说的是"功能",但谷歌将Daily Brief称为"一个新智能体"。先不纠结定义,但就目前来看,这个功能似乎还达不到今年行业所树立的智能体标准。
客观地说,Daily Brief确实展现了一定程度的深度推理能力:虽然我们尚未亲自测试,但从两次独立演示来看,它不仅能呈现当天安排,还能主动提示本周晚些时候即将发生的费用扣款,甚至判断出测试用户即将进行厨房翻新,并建议提前布置临时烹饪区域。
但到这里,"智能体"的能力就止步了。当我询问这项功能能否基于这些信息主动采取行动时,一位谷歌员工告诉我,用户应该直接打开Gemini聊天窗口,或者使用Spark——谷歌全新的"个人智能体",而它(再一次令人迷惑地)就住在Gemini里面。
这……就是全部了?
每日简报是智能体总结工作的产物,但简报本身算是智能体吗?按照谷歌的定义,我持保留意见(当然,实际上手体验也许会发现更多智能体特性)。从已连接应用中提取并整合数据,确实需要智能体能力,但Daily Brief对这些能力的运用范围相当有限。
从整个AI行业的发展预期来看,谷歌在这方面的推出也稍显滞后。
"提供每日简报,是AI助手的标志性能力之一。许多人也在使用Claude来完成这类工作,"ZDNET特约撰稿人David Gewirtz表示,"在AI领域,这绝对不是什么新鲜功能。自从智能体开始变得实用以来,每日简报就一直是热门话题。"
有了这层背景,我的疑问和对Docs Live、Gmail Live的疑问如出一辙:为什么不直接把Daily Brief作为一项新功能并入Gemini,哪怕它早就应该上线?
Gemini各个层级的能力已经被分散在不同界面中,彼此之间仅凭略有差异的名称加以区分。本月初上线的Gemini Intelligence是专属于Android平台的分支,主打智能体与多任务能力。这与Gemini Personal Intelligence不同——后者会根据你授权访问的数据,对查询结果进行个性化定制。
此外还有搜索中的Gemini,以及独立的Gemini应用。
这种分散布局,可能让用户对Gemini究竟能做什么感到茫然,最终选择无视。从技术角度看,谷歌可能是出于跨平台性能差异的考量,对不同版本的Gemini产品加以区分;在开发者或产品经理看来,这样区分Android版本也许合情合理。
但从市场营销的角度,这些区别也许没必要在消费者面前如此突出。
即便各大AI实验室正在向企业级市场转型,消费级AI工具的赛道依然活跃,竞争激烈。让用户难以搞清楚你家产品的边界和功能,恐怕不会是一个有利于竞争的做法。
Q&A
Q1:Docs Live和Gmail Live与Gemini Live有什么区别?
A:从功能逻辑上看,Docs Live和Gmail Live与Gemini Live高度相似,都是通过语音与谷歌应用交互。Docs Live允许用户通过语音在手机上生成文档,Gmail Live则可以通过语音查询邮件内容。它们本质上是Gemini Live能力在特定应用中的延伸,并非全新的技术突破,只是被赋予了独立的产品名称并限定在各自的平台内使用。
Q2:Daily Brief功能能够自动执行任务吗?
A:目前Daily Brief的能力仍然有限,主要停留在信息汇总和日程呈现层面。它能从邮件、日历等关联应用中提取信息,生成当天的日程概览,还能提前提示即将发生的费用或活动安排。但如果用户希望基于这些信息执行具体操作,谷歌员工表示需要另外打开Gemini聊天窗口或使用Spark智能体,Daily Brief本身无法直接采取行动。
Q3:Docs Live和Gmail Live现在对所有用户开放吗?
A:目前这两项功能仅向AI Pro订阅用户(月费20美元)和Ultra订阅用户(月费至少100美元)开放,今年夏天将对Workspace企业用户进入预览阶段。是否会最终向所有谷歌用户普及,或并入Gemini统一功能体系,目前尚无明确说明。此外,两项功能目前看起来只在移动端提供。
好文章,需要你的鼓励
根据SpaceX近期发布的IPO招股书,Anthropic同意每月向SpaceX支付12.5亿美元,以获取其位于田纳西州孟菲斯的Colossus I和Colossus II数据中心的AI训练算力,合同期至2029年5月,年费高达150亿美元。协议设有90天终止条款。目前Anthropic正朝季度盈利迈进,预计销售收入将超过109亿美元。
这项联合研究提出了COVER方法和CM-EVS数据集,用贪心算法从3D场景中智能筛选全景视角,每场景仅需25帧即可完整覆盖室内场景,并附完整溯源日志。
美国商务部宣布与IBM合作建立首个量子晶圆厂,获CHIPS法案最高10亿美元资金支持,旨在扩大国内量子硬件产能。与此同时,D-Wave Quantum也获得联邦量子资金支持,政府将持有其1亿美元股权。两项举措标志着美国工业政策从半导体制造和AI基础设施向量子计算领域延伸,将其纳入国家安全与经济竞争战略。2025年量子科技初创投资已达126亿美元,市场前景持续扩大。
HolderPO通过引入可调参数p的霍尔德均值替代固定的算术平均,解决了大模型推理训练中信号放大与稳定性之间的根本矛盾,配合动态退火策略在数学推理和代理任务上均创造了新的最优记录。