谷歌在2025年花费大量精力为其人工智能产品Gemini增强功能。现在,公司正专注于如何在其广泛的硬件和Android软件阵列中最好地应用这些技术,帮助人们找到真正有用的AI使用方式。
Gemini在2025年表现出色,凭借Veo 3视频和Nano Banana等行业领先模型进军创意AI领域。AI模式引入了智能体功能,让AI代替用户进行搜索。Gemini 3展示了公司最先进的大语言模型,引起了OpenAI和其他竞争对手的关注。
今年,谷歌希望将这些突破性模型和能力的开发进展应用到设备中,无论是Android智能手机、Chromebook、智能眼镜还是电视。最终目标是专注于AI的实际用途。谷歌Android生态系统总裁萨米尔·萨马特将其称为"AI实用性"。
"AI实用性真正体现了普通消费者如何体验这项技术并说'哇,这真的很强大',"萨马特在CES 2026接受采访时表示。"这要么让我真正喜欢拥有这个产品,要么让我想要转换使用它。"
为AI构建实际用途对谷歌来说并非新理念。2024年,公司在Android上推出了"圈选搜索"功能,正如名字所示:你可以在手机屏幕上的照片周围画一个圆圈,它使用视觉智能分析相关信息,运行谷歌搜索并显示额外信息。AI驱动的垃圾邮件防护改进意味着据谷歌自己的研究,Android用户报告的垃圾信息比iPhone用户少58%。最近,它在使用谷歌地图时增加了与Gemini免提聊天的功能,帮助用户寻找附近的停车场或餐厅。
Android设备已经集成了大量AI功能,但AI实用性的概念不仅限于手机和计算机。例如,谷歌一直在稳步将Gemini添加到电视中,首先从观看推荐开始。
1月份,公司宣布扩展电视上的AI集成功能。深度分析可以在不到2分钟内为任何你想要的主题创建定制多媒体演示。你可以像使用聊天机器人一样与电视聊任何事情。类似于谷歌照片中混音工具的AI驱动照片编辑功能也正在进入大屏幕。如果愿意,你还可以使用谷歌的流行模型从头制作AI图像和视频。
引入这些类似聊天机器人的搜索和媒体功能,不是为了推动人们在电视上创建AI图像,而是为了在人们需要的地方满足他们。如果你喜欢在电视上展示家庭照片作为屏保,你可以利用AI驱动的编辑工具为它们添加自己的定制风格。谷歌在CES的现场演示中表示,这一切都是为了让看电视成为一种更具参与性、更少被动的活动。
引入更多实用AI工具的另一种方式是构建智能体AI或AI智能体。这种生成式AI类型被设计用来独立处理任务,无需人类监督,比如订餐或运行代码。现在,我们"正处于智能体能够为我们完成实际任务的边缘",萨马特说。在桌面和移动应用程序之外构建这项技术将是关键。
"对这种功能的一些最大需求将来自其他形态因素,它们可能有更小的屏幕、完全没有屏幕,或者需要免提操作,"萨马特说。这可能是在车辆内部的软件中,包括自动驾驶汽车,但也可能在智能眼镜中,谷歌此前表示将其视为AI演进的重要组成部分。
谷歌对实用性的关注反映了一个增长趋势和向AI发展下一阶段的转移。如果我们将聊天机器人视为互联网的早期版本,如AOL,那么向个性化智能体AI工具的转移就是新的谷歌。
AI不再是新奇事物。在2026年,我们所有人——构建AI的人和使用AI的人——都应该投资于寻找集成AI的具体、有效方式。虽然你可能喜欢使用Nano Banana,但你也希望Android的AI能让你的生活更轻松。
"我们认为这项技术可以让人们从AI好奇转向AI实用,并感受到Android设备是有帮助的、有趣的和令人愉悦的,"萨马特说。
Q&A
Q1:什么是AI实用性?谷歌如何定义这个概念?
A:AI实用性是谷歌Android生态系统总裁萨马特提出的概念,指的是普通消费者体验AI技术时能够感受到"真的很强大"的实际用途。它要么让用户真正喜欢拥有某个产品,要么让用户想要转换使用它,重点在于AI的实际应用价值而非新奇性。
Q2:谷歌Gemini在2025年取得了哪些重要进展?
A:Gemini在2025年表现出色,主要成就包括:凭借Veo 3视频和Nano Banana等行业领先模型成功进军创意AI领域;推出AI模式引入智能体功能,让AI能够代替用户进行搜索;发布Gemini 3展示了公司最先进的大语言模型,引起了OpenAI等竞争对手的关注。
Q3:谷歌智能体AI技术有什么特点和应用前景?
A:智能体AI是一种能够独立处理任务、无需人类监督的生成式AI技术,可以完成订餐或运行代码等任务。萨马特表示我们正处于智能体能够完成实际任务的边缘。这项技术特别适用于小屏幕、无屏幕或需要免提操作的设备,如车辆软件、自动驾驶汽车和智能眼镜等。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。