谷歌在今年一年一度的I/O开发者大会上,宣布了旗下Gemini应用的多项重大更新。除了引人注目的界面重新设计之外,谷歌还为Gemini带来了两款全新AI模型,并正在测试一个能够自动完成后台任务的常驻AI智能体。
以下是本次I/O大会上Gemini宣布的全部重要更新。
速度更快、能力更强的Gemini 3.5 Flash正式上线
谷歌最新旗舰AI模型将登陆Gemini应用。谷歌表示,全新的Gemini 3.5 Flash在速度与效率上均超越同类主流AI模型,同时具备生成"更丰富、更具交互性"的网页用户界面与图形的能力。此外,在辅助开发实用AI智能体方面,该模型也实现了"重大飞跃"——根据谷歌的测评数据,其在编程与智能体基准测试中的表现已超过Gemini 3.1 Pro。
Gemini 3.5 Flash仅是Gemini 3.5系列的首款产品,谷歌计划于下个月正式推出3.5 Pro版本。
Gemini迎来"Neural Expressive"全新视觉设计
除了新模型之外,谷歌还为Gemini应用带来了一套名为"Neural Expressive"的全新设计语言。升级后的应用拥有更流畅的动画效果、更鲜明的色彩搭配、全新的字体排版,以及点击按钮时的触感反馈。
谷歌同时对Gemini的回复展示方式进行了优化,最重要的信息将优先呈现在顶部,并配以图片、交互式时间轴、旁白视频和动态图表。此外,谷歌还简化了从文字输入切换至语音交互模式Gemini Live的操作流程,该模式即将支持更多地区方言。"Neural Expressive"新设计将陆续在网页版、Android及iOS版Gemini应用中全面铺开。
Gemini Omni Flash:任意输入皆可生成视频
谷歌在Gemini应用中引入了一种全新类型的模型,未来将实现"接受任意输入、生成任意内容"。该系列的首款产品Gemini Omni Flash目前支持结合图片、音频、视频与文字等多种输入方式来生成视频。谷歌表示,Gemini Omni能够创建具有更真实物理效果的场景,并具备对"下一步内容"进行推理的能力。
与此同时,谷歌还推出了全新的Avatars功能,用户可以使用自己的声音,创建以数字化身形象出现的视频。用户还可以通过在Gemini应用中对话的方式,对Gemini Omni的生成内容进行编辑。Gemini Omni Flash目前正在向Google AI Plus、Pro及Ultra订阅用户开放,覆盖Gemini应用与Google Flow平台,同时也将在YouTube Shorts及YouTube创作者应用上免费提供。
Gemini Spark:谷歌推出常驻后台AI智能体
谷歌正式推出Gemini Spark,这是一款"始终在线"的AI智能体,可在用户处理其他事务的同时,在后台自动完成各类任务。Gemini Spark与今年早些时候引发科技圈广泛关注的开源AI智能体平台OpenClaw理念相近。
Gemini Spark能够执行发送邮件、扫描月度信用卡账单以识别隐藏订阅费用、整理会议记录摘要等任务。它基于Gemini 3.5 Flash运行,可接入Docs、Sheets、Slides等Google Workspace应用,以及Canva、Instacart、OpenTable等第三方应用。此外,该AI智能体还可以通过macOS版Gemini应用访问本地文件。
Gemini Spark本周已向受邀测试用户开放,并计划于下周面向美国地区的Google AI Ultra订阅用户启动公测。
Gemini Daily Brief:一站式日程简报助手
谷歌还为Gemini应用带来了一款名为"Daily Brief"的全新AI智能体。它能够整合用户已连接至Gemini的各类应用中的信息,汇总来自日历的待办事项与来自Gmail的最新消息,生成一份个性化的每日简报。
谷歌表示,Daily Brief将依据用户的目标对简报内容进行整理与优先级排序,用户还可以通过点赞或点踩来对简报质量进行反馈。Daily Brief从本周二起面向美国地区的Google AI Plus、Pro及Ultra订阅用户正式推出。
Q&A
Q1:Gemini 3.5 Flash相比之前的版本有哪些提升?
A:Gemini 3.5 Flash是谷歌最新旗舰AI模型,速度和效率均优于同类主流AI模型,支持生成更丰富、更具交互性的网页界面与图形。在编程和AI智能体基准测试中,其表现已超过Gemini 3.1 Pro,同时这也是Gemini 3.5系列的首款产品,后续还将推出3.5 Pro版本。
Q2:Gemini Spark智能体具体能帮用户做什么?
A:Gemini Spark是一款"始终在线"的后台AI智能体,用户在处理其他事务时,它可以自动完成多种任务,包括发送邮件、扫描信用卡账单识别隐藏订阅费用、整理会议记录等。它基于Gemini 3.5 Flash运行,支持接入Google Workspace及Canva、Instacart等第三方应用,macOS用户还可通过它访问本地文件。
Q3:Gemini Omni Flash生成视频的功能有哪些特点?
A:Gemini Omni Flash支持融合图片、音频、视频与文字等多种输入方式来生成视频,生成的场景具有更真实的物理效果,并能对后续内容进行智能推理。此外还配备了Avatars功能,用户可用自己的声音制作数字化身视频,并通过对话方式编辑生成结果。该功能向Google AI订阅用户开放,同时也在YouTube Shorts上免费提供。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。