谷歌于周二正式发布了Gemini 3.5 Flash,这是该公司迄今为止在编程与自主AI智能体领域性能最强的一款模型。该模型在谷歌一年一度的I/O开发者大会上正式亮相,能够独立执行编程流水线、管理研究项目,并在内部测试中完全从零搭建起一套操作系统。
此次发布标志着谷歌的AI战略重心从"对话工具"转向"智能体工具"——AI不再只是回答问题,而是能够在极少人工干预的情况下,独立规划、构建并持续推进实际工作任务。
"Gemini 3.5 Flash在质量与低延迟之间实现了令人印象深刻的平衡,"DeepMind首席技术官Koray Kavukcuoglu在公开发布前一天向媒体表示,"它在几乎所有基准测试中都超越了我们最新的前沿模型3.1 Pro,涵盖编程、智能体任务和多模态推理等维度。"
他还补充道,该模型的运行速度是其他前沿模型的四倍,这一特性非常适合编程和智能体任务的应用场景。谷歌更进一步推出了经过专项优化的Flash版本,在保持同等质量的前提下,速度提升至常规版本的12倍。
据Kavukcuoglu介绍,这种高速性能是Flash针对智能体任务的核心设计理念——在执行长时间运行的任务时,可同时调度多个AI智能体协同工作。在I/O大会的现场演示中,谷歌工程师Varun Mohan展示了智能体如何分头并行处理各个子模块,最终在谷歌的智能体开发平台Antigravity中协作完成一个完整操作系统的构建。
Kavukcuoglu表示,Flash 3.5是与Antigravity协同研发的,旨在为智能体提供一个"可以生存、工作和执行任务的原生环境"。
在本届I/O大会上,谷歌还正式推出了Antigravity 2.0——一款以智能体优先为核心理念设计的独立桌面应用程序。
实际成效已不止停留在演示层面。谷歌表示,3.5 Flash的智能体能力已在合作伙伴中产生切实价值,包括银行、金融科技公司自动化处理原本需要数周完成的工作流程,以及数据科学团队在复杂数据环境中高效提取洞察等。
该模型可自主连续运行数小时。不过,谷歌产品负责人、高级总监Tulsee Doshi指出,当模型在运行中遇到需要人工判断的决策节点或权限问题时,会主动暂停并向用户请求输入。
谷歌即将推出的3.5 Pro模型设计为与3.5 Flash协同配合。"3.5 Pro担任整体协调者与规划者的角色,并可调用Flash作为各个子智能体,"Doshi向媒体表示,"关键在于哪些环节真正需要强大的推理能力、需要更大的模型深度发力,哪些任务则更适合高效的工具调用能力。"
目前,3.5 Flash已成为全球Gemini应用及搜索AI模式的默认模型。谷歌在I/O大会上同时宣布,将在搜索功能中引入智能体能力,允许用户直接在平台上创建、定制和管理AI智能体。此外,新模型还将为Gemini Spark提供支撑——这是谷歌面向普通消费者推出的全新个人AI智能体,可全天候运行,帮助用户管理数字生活。
然而,向普通消费者开放如此强大的AI能力也带来了审视与争议。去年,一名男性在与Gemini持续对话数周后险些制造大规模伤亡事件并最终自杀,谷歌目前正面临由此引发的诉讼。
当更强大的自主智能体面向更广泛的人群开放时,潜在的伤害风险也随之扩大。对此,谷歌表示Gemini 3.5在网络安全及CBRN(化学、生物、放射性和核)领域的防护能力得到了强化,并对涉及敏感问题的处理方式进行了更精细的调校,使其能够以更妥当的方式参与对话,而非一律回避拒绝。
Gemini 3.5 Flash现已通过Antigravity、Gemini API和Gemini Enterprise全面开放使用,同时也可通过Gemini应用及搜索中的AI模式访问。
Q&A
Q1:Gemini 3.5 Flash模型的速度优势有多大?
A:根据谷歌官方介绍,Gemini 3.5 Flash的运行速度是其他前沿模型的四倍。谷歌还进一步推出了专项优化版本,在维持相同质量水平的前提下,速度可达标准版的12倍。这种高速性能专为编程和智能体任务场景设计,支持多个AI智能体同时并行执行长时间复杂任务。
Q2:Gemini 3.5 Flash和即将推出的3.5 Pro模型有什么区别?
A:两款模型定位不同、协同配合。3.5 Pro主要担任整体协调者与规划者的角色,负责高复杂度的推理任务;3.5 Flash则作为高速执行的子智能体,负责具体的工具调用和任务处理。谷歌的设计思路是,根据任务对推理深度和执行效率的不同需求,在两款模型之间灵活分配工作。
Q3:Gemini 3.5 Flash目前在哪些产品中可以使用?
A:Gemini 3.5 Flash现已全面上线,已成为全球Gemini应用和搜索AI模式的默认模型。开发者可通过Antigravity平台、Gemini API及Gemini Enterprise接入使用。此外,该模型还将为谷歌新推出的个人AI智能体Gemini Spark提供底层支撑。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。