AI的发展持续让我对未来抱有复杂的心情,在刚刚结束的以Gemini为重头戏的谷歌I/O大会之后,这种感受更加强烈。一方面,谷歌确实展示出了一些最具实用价值的AI应用理念;但在真正建立起信任之前,我实在难以对此感到由衷的兴奋。
AI领域充斥着数不尽的想法,但我认为其中很多并不值得我们花费时间、精力,以及投入大量资源去构建。每当听到新的AI产品或推广时,我的第一反应往往是:"我为什么要用这个?"太多的产品只是为了做AI而做AI,或者试图用捷径来替代人类的参与。这类产品让我难以认同——AI当然在现代生活中有其一席之地,这些模型也足够强大,但我坚信,所有AI的设计都应该以真实使用它的人为核心出发点。
这也是为什么在众多AI努力中,谷歌的方向最能吸引我目光的根本原因。
当大多数AI公司将重心放在编程等盈利性应用上时,谷歌仍在探索AI如何在通用聊天机器人之外,在日常生活中真正帮助到普通用户。谷歌旗下的Google Home和Fitbit(现已更名为Google Health)就是很好的例证。正因如此,我对谷歌AI方向的后续发展保持着真实的期待,而对其他许多AI产品,我几乎提不起兴趣。
本次谷歌I/O大会呈现出了两种不同路径的交汇。一方面,有一些真正实用、切实可行的创意。"Universal Cart"作为一款跨全网运作的优惠追踪与主动购物车功能,潜力巨大。在搜索中运用"生成式UI"来创建针对特定使用场景的小型交互应用,也是一个很好的工具,能帮助用户真正理解某个主题,而不仅仅是面对满屏的文字。
但另一方面,也有一些我并不认同的想法。Gemini Omni生成的以假乱真的视频固然令人印象深刻,但能够制作出如此逼真视频所带来的社会影响不容小觑——而互联网上已经充斥着太多劣质的AI生成内容。
"Docs Live"同样让我感到不安。让用户通过口述来帮助AI生成提纲,这个出发点还算无害;但谷歌在发布会现场展示的"用AI紧急生成一篇自己忘了准备的演讲稿"这个例子,感觉……只能说很糟糕。它让我脑海中浮现出的真实感受是:"这样的世界我不想继续待下去。"我个人非常反感那些本质上只是在教人偷懒的AI演示——人类本能地会走最省力的路,而我真心希望谷歌和所有AI公司能够意识到:当人们不断依赖这些工具时,人类独立思考的能力正在被一点一点蚕食。
本次I/O大会的核心焦点,很明显集中在"智能体"上——这类工具允许用户将任务(基本上)交由AI代为处理。同样,我对此的感受也是复杂的。一方面,我能接受用这些工具来加速现有工作流程的想法。Gemini Spark提供了一些有趣的例子,比如识别信用卡账单中的异常订阅费用,或从收件箱中自动提取并汇总截止日期以便查阅。
但当我思考如何将其应用到自己生活中时,脑海中反复出现的,是我从生成式AI这一时代开始就一直有的那个念头——我根本不信任它。
一次又一次,Gemini和我尝试融入日常生活的每一款AI工具,都在某些时刻彻底无法正确完成任务,或者信誓旦旦地对我撒谎。这种情况随时间推移略有改善,但本质问题依然存在。就在最近,我们的同事Will Sattelberg开始测试Google Health Coach,结果第一天它就凭空生成了一段他根本没跑过的几英里记录。我自己使用Coach的经历虽然没有出现相同情况,但在与各种形态的Gemini交互时,遇到类似的"幻觉"或"自信谎言"对我来说并不罕见。然而,我们却被一再告知,这在某种程度上是正常的。
这正是我对智能体产生担忧的所在。我毫不怀疑谷歌正在构建的这些工具最终能够兑现它们的承诺,我只是担心它不可避免出错的那一刻。回到谷歌给出的那两个例子——如果在我预算紧张的时候,智能体完全漏掉了某笔隐藏费用,该怎么办?如果它为我正在推进的项目凭空生成了一个截止日期,又该怎么办?智能体不会主动告诉我它哪里出了问题,它只会像往常一样以百分之百的自信给出答案。如此一来,我还是得亲自去核查,那我究竟节省了多少时间?
Gemini Spark即将推出的第一个功能是"Daily Brief"——它会巧妙地深入挖掘你在其他谷歌产品中的数据,找出一些你可能需要处理的事项。我已经开始体验这一功能,说实话,确实挺酷的。它能够从我的浏览记录和Gmail中提取相关信息,比如一个我从未添加到日历中的电话预约,甚至还关联到了我之前与Gemini Live就此话题的历史对话。相当不错,也很实用!但它同时还莫名其妙地拉取了我最近浏览二手电动车的记录。这让我有一种回到"为了AI而AI"的感觉——因为它提供的摘要内容毫无实际价值。
总体而言,我认为2026年谷歌I/O大会仍然是近期以来我们所见过的最优秀的实用AI展示之一,但它依然让我感到两难。谷歌在构建这些实用应用的过程中,持续迭代并不断尝试新想法——这是好事,也是我们应该对每家AI公司所提出的要求。但与此同时,有太多的地方让我看到的是我无法信任的东西,或者干脆就是劣质的AI内容。更不用说搜索功能持续调整所带来的影响——那些改变似乎正在不断侵蚀整个网络生态。
这就是我目前的状态——对谷歌AI未来的发展既抱有乐观期待,又同样忧虑于它可能带来的深远影响。
Q&A
Q1:谷歌I/O 2026发布了哪些实用的AI新功能?
A:本次大会上,谷歌展示了多个实用功能。"Universal Cart"可跨全网追踪优惠并主动管理购物车;搜索中的"生成式UI"能为特定需求生成小型交互应用,帮助用户更好地理解主题内容;Gemini Spark推出的"Daily Brief"则能整合用户在各谷歌产品中的数据,自动提取待处理事项;此外还有识别信用卡隐藏费用、自动汇总邮件截止日期等智能体功能。
Q2:Gemini的智能体功能为什么让人担忧?
A:尽管Gemini智能体承诺能代替用户自动完成各类任务,但其可靠性仍存在较大问题。AI在执行任务时可能出现"幻觉",即以百分之百的自信给出错误信息,却不会主动告知用户出错了。例如,Google Health Coach曾凭空生成用户根本没有进行过的跑步记录。一旦智能体漏掉关键信息或生成错误内容,用户仍需自行核查,反而可能抵消了使用它所节省的时间。
Q3:谷歌Gemini Omni生成的视频内容有哪些争议?
A:Gemini Omni能够生成高度逼真的视频内容,技术层面确实令人印象深刻。但这项能力引发了对社会影响的担忧——如此以假乱真的视频一旦被滥用,可能加剧网络上已经泛滥的劣质AI生成内容问题,对信息真实性和公众辨别能力构成潜在威胁。
好文章,需要你的鼓励
Spotify与环球音乐集团达成授权协议,允许付费订阅用户使用人工智能技术创建歌曲翻唱和混音版本。这是该流媒体平台首次允许听众通过AI创作内容。新功能将以付费附加服务形式推出,为艺术家和词曲作者创造额外收入来源。双方强调该计划以艺术家为中心,基于同意、署名和报酬原则,旨在支持人类艺术创作并推动整个音乐生态系统增长。
Graft是浙江大学与阿里巴巴联合提出的推测解码加速框架,通过"剪枝释放预算、检索补偿损失"的嫁接策略,无需训练即可将大模型推理速度提升最高5.41倍。
今天讲的出海案例是特锐德,这家预制舱变电站和充电网公司,把海外天然气发电场景首次应用落到沙特加兹兰电厂,并以阿曼 400kV 项目证明高压交付能力。
这项研究开发了全球首个评估AI能否按儿童认知年龄思考的测评框架ChildAgentEval,发现仅靠提示词指令无法让AI真正"变小",需系统性认知约束才能实现有效的年龄对齐。