谷歌于周二正式发布了Gemini 3.5 Flash,这是该公司迄今为止在编程与自主AI智能体领域性能最强的一款模型。该模型在谷歌一年一度的I/O开发者大会上正式亮相,能够独立执行编程流水线、管理研究项目,并在内部测试中完全从零搭建起一套操作系统。
此次发布标志着谷歌的AI战略重心从"对话工具"转向"智能体工具"——AI不再只是回答问题,而是能够在极少人工干预的情况下,独立规划、构建并持续推进实际工作任务。
"Gemini 3.5 Flash在质量与低延迟之间实现了令人印象深刻的平衡,"DeepMind首席技术官Koray Kavukcuoglu在公开发布前一天向媒体表示,"它在几乎所有基准测试中都超越了我们最新的前沿模型3.1 Pro,涵盖编程、智能体任务和多模态推理等维度。"
他还补充道,该模型的运行速度是其他前沿模型的四倍,这一特性非常适合编程和智能体任务的应用场景。谷歌更进一步推出了经过专项优化的Flash版本,在保持同等质量的前提下,速度提升至常规版本的12倍。
据Kavukcuoglu介绍,这种高速性能是Flash针对智能体任务的核心设计理念——在执行长时间运行的任务时,可同时调度多个AI智能体协同工作。在I/O大会的现场演示中,谷歌工程师Varun Mohan展示了智能体如何分头并行处理各个子模块,最终在谷歌的智能体开发平台Antigravity中协作完成一个完整操作系统的构建。
Kavukcuoglu表示,Flash 3.5是与Antigravity协同研发的,旨在为智能体提供一个"可以生存、工作和执行任务的原生环境"。
在本届I/O大会上,谷歌还正式推出了Antigravity 2.0——一款以智能体优先为核心理念设计的独立桌面应用程序。
实际成效已不止停留在演示层面。谷歌表示,3.5 Flash的智能体能力已在合作伙伴中产生切实价值,包括银行、金融科技公司自动化处理原本需要数周完成的工作流程,以及数据科学团队在复杂数据环境中高效提取洞察等。
该模型可自主连续运行数小时。不过,谷歌产品负责人、高级总监Tulsee Doshi指出,当模型在运行中遇到需要人工判断的决策节点或权限问题时,会主动暂停并向用户请求输入。
谷歌即将推出的3.5 Pro模型设计为与3.5 Flash协同配合。"3.5 Pro担任整体协调者与规划者的角色,并可调用Flash作为各个子智能体,"Doshi向媒体表示,"关键在于哪些环节真正需要强大的推理能力、需要更大的模型深度发力,哪些任务则更适合高效的工具调用能力。"
目前,3.5 Flash已成为全球Gemini应用及搜索AI模式的默认模型。谷歌在I/O大会上同时宣布,将在搜索功能中引入智能体能力,允许用户直接在平台上创建、定制和管理AI智能体。此外,新模型还将为Gemini Spark提供支撑——这是谷歌面向普通消费者推出的全新个人AI智能体,可全天候运行,帮助用户管理数字生活。
然而,向普通消费者开放如此强大的AI能力也带来了审视与争议。去年,一名男性在与Gemini持续对话数周后险些制造大规模伤亡事件并最终自杀,谷歌目前正面临由此引发的诉讼。
当更强大的自主智能体面向更广泛的人群开放时,潜在的伤害风险也随之扩大。对此,谷歌表示Gemini 3.5在网络安全及CBRN(化学、生物、放射性和核)领域的防护能力得到了强化,并对涉及敏感问题的处理方式进行了更精细的调校,使其能够以更妥当的方式参与对话,而非一律回避拒绝。
Gemini 3.5 Flash现已通过Antigravity、Gemini API和Gemini Enterprise全面开放使用,同时也可通过Gemini应用及搜索中的AI模式访问。
Q&A
Q1:Gemini 3.5 Flash模型的速度优势有多大?
A:根据谷歌官方介绍,Gemini 3.5 Flash的运行速度是其他前沿模型的四倍。谷歌还进一步推出了专项优化版本,在维持相同质量水平的前提下,速度可达标准版的12倍。这种高速性能专为编程和智能体任务场景设计,支持多个AI智能体同时并行执行长时间复杂任务。
Q2:Gemini 3.5 Flash和即将推出的3.5 Pro模型有什么区别?
A:两款模型定位不同、协同配合。3.5 Pro主要担任整体协调者与规划者的角色,负责高复杂度的推理任务;3.5 Flash则作为高速执行的子智能体,负责具体的工具调用和任务处理。谷歌的设计思路是,根据任务对推理深度和执行效率的不同需求,在两款模型之间灵活分配工作。
Q3:Gemini 3.5 Flash目前在哪些产品中可以使用?
A:Gemini 3.5 Flash现已全面上线,已成为全球Gemini应用和搜索AI模式的默认模型。开发者可通过Antigravity平台、Gemini API及Gemini Enterprise接入使用。此外,该模型还将为谷歌新推出的个人AI智能体Gemini Spark提供底层支撑。
好文章,需要你的鼓励
今天讲的出海案例是利亚德,这家 1995 年成立、从 LED 显示产品研发生产销售起步,并做到小间距和 Micro LED 的视效科技公司,沙特工厂预计 2026 年 7 月投产。
ATLAS是由香港中文大学与Meta AI联合提出的视觉推理框架,将视觉操作压缩为词典中的五个特殊词汇,让AI无需生成图片或调用外部工具,即可完成复杂的交互式视觉推理。
谷歌在I/O 2026大会上宣布,Android Auto将对媒体应用进行重大界面升级。此次更新基于Car App Library v1.9.0-alpha01,引入扩展标题、聚焦区域、新型进度条、快捷芯片和迷你播放器等全新组件,提升布局灵活性。开发者可申请加入测试计划提前体验,Spotify、YouTube等热门应用将率先采用新设计。
SPIN是由纽约州立大学奥尔巴尼分校与IBM联合提出的工业AI规划框架,通过格式验证修复和前缀渐进执行控制,在减少40%执行步骤的同时提升任务完成率。