Gemini五大重磅更新,谷歌I/O 2026全面解析

谷歌在I/O 2026开发者大会上宣布了Gemini应用的重要更新。新版本引入更快速的Gemini 3.5 Flash模型,带来"神经表达"设计风格,提升动画与交互体验。全新Gemini Omni Flash支持多模态视频生成,可基于图像、音频、文字创作逼真视频。Gemini Spark作为"常驻"AI智能体,可在后台自动处理邮件、扫描账单等任务。Daily Brief功能则整合日历与邮件,为用户提供每日智能摘要。

谷歌在今年一年一度的I/O开发者大会上,宣布了旗下Gemini应用的多项重大更新。除了引人注目的界面重新设计之外,谷歌还为Gemini带来了两款全新AI模型,并正在测试一个能够自动完成后台任务的常驻AI智能体。

以下是本次I/O大会上Gemini宣布的全部重要更新。

速度更快、能力更强的Gemini 3.5 Flash正式上线

谷歌最新旗舰AI模型将登陆Gemini应用。谷歌表示,全新的Gemini 3.5 Flash在速度与效率上均超越同类主流AI模型,同时具备生成"更丰富、更具交互性"的网页用户界面与图形的能力。此外,在辅助开发实用AI智能体方面,该模型也实现了"重大飞跃"——根据谷歌的测评数据,其在编程与智能体基准测试中的表现已超过Gemini 3.1 Pro。

Gemini 3.5 Flash仅是Gemini 3.5系列的首款产品,谷歌计划于下个月正式推出3.5 Pro版本。

Gemini迎来"Neural Expressive"全新视觉设计

除了新模型之外,谷歌还为Gemini应用带来了一套名为"Neural Expressive"的全新设计语言。升级后的应用拥有更流畅的动画效果、更鲜明的色彩搭配、全新的字体排版,以及点击按钮时的触感反馈。

谷歌同时对Gemini的回复展示方式进行了优化,最重要的信息将优先呈现在顶部,并配以图片、交互式时间轴、旁白视频和动态图表。此外,谷歌还简化了从文字输入切换至语音交互模式Gemini Live的操作流程,该模式即将支持更多地区方言。"Neural Expressive"新设计将陆续在网页版、Android及iOS版Gemini应用中全面铺开。

Gemini Omni Flash:任意输入皆可生成视频

谷歌在Gemini应用中引入了一种全新类型的模型,未来将实现"接受任意输入、生成任意内容"。该系列的首款产品Gemini Omni Flash目前支持结合图片、音频、视频与文字等多种输入方式来生成视频。谷歌表示,Gemini Omni能够创建具有更真实物理效果的场景,并具备对"下一步内容"进行推理的能力。

与此同时,谷歌还推出了全新的Avatars功能,用户可以使用自己的声音,创建以数字化身形象出现的视频。用户还可以通过在Gemini应用中对话的方式,对Gemini Omni的生成内容进行编辑。Gemini Omni Flash目前正在向Google AI Plus、Pro及Ultra订阅用户开放,覆盖Gemini应用与Google Flow平台,同时也将在YouTube Shorts及YouTube创作者应用上免费提供。

Gemini Spark:谷歌推出常驻后台AI智能体

谷歌正式推出Gemini Spark,这是一款"始终在线"的AI智能体,可在用户处理其他事务的同时,在后台自动完成各类任务。Gemini Spark与今年早些时候引发科技圈广泛关注的开源AI智能体平台OpenClaw理念相近。

Gemini Spark能够执行发送邮件、扫描月度信用卡账单以识别隐藏订阅费用、整理会议记录摘要等任务。它基于Gemini 3.5 Flash运行,可接入Docs、Sheets、Slides等Google Workspace应用,以及Canva、Instacart、OpenTable等第三方应用。此外,该AI智能体还可以通过macOS版Gemini应用访问本地文件。

Gemini Spark本周已向受邀测试用户开放,并计划于下周面向美国地区的Google AI Ultra订阅用户启动公测。

Gemini Daily Brief:一站式日程简报助手

谷歌还为Gemini应用带来了一款名为"Daily Brief"的全新AI智能体。它能够整合用户已连接至Gemini的各类应用中的信息,汇总来自日历的待办事项与来自Gmail的最新消息,生成一份个性化的每日简报。

谷歌表示,Daily Brief将依据用户的目标对简报内容进行整理与优先级排序,用户还可以通过点赞或点踩来对简报质量进行反馈。Daily Brief从本周二起面向美国地区的Google AI Plus、Pro及Ultra订阅用户正式推出。

Q&A

Q1:Gemini 3.5 Flash相比之前的版本有哪些提升?

A:Gemini 3.5 Flash是谷歌最新旗舰AI模型,速度和效率均优于同类主流AI模型,支持生成更丰富、更具交互性的网页界面与图形。在编程和AI智能体基准测试中,其表现已超过Gemini 3.1 Pro,同时这也是Gemini 3.5系列的首款产品,后续还将推出3.5 Pro版本。

Q2:Gemini Spark智能体具体能帮用户做什么?

A:Gemini Spark是一款"始终在线"的后台AI智能体,用户在处理其他事务时,它可以自动完成多种任务,包括发送邮件、扫描信用卡账单识别隐藏订阅费用、整理会议记录等。它基于Gemini 3.5 Flash运行,支持接入Google Workspace及Canva、Instacart等第三方应用,macOS用户还可通过它访问本地文件。

Q3:Gemini Omni Flash生成视频的功能有哪些特点?

A:Gemini Omni Flash支持融合图片、音频、视频与文字等多种输入方式来生成视频,生成的场景具有更真实的物理效果,并能对后续内容进行智能推理。此外还配备了Avatars功能,用户可用自己的声音制作数字化身视频,并通过对话方式编辑生成结果。该功能向Google AI订阅用户开放,同时也在YouTube Shorts上免费提供。

来源:The Verge

0赞

好文章,需要你的鼓励

2026

05/20

16:08

分享

点赞

邮件订阅