进入 AI 智能体时代,谷歌今日正式发布 Gemini Spark,这是一款全天候运行的个人 AI 助手,旨在帮助用户管理数字生活并代为处理实际工作。
Gemini Spark 底层搭载最新发布的 Gemini 3.5 Flash 模型,并借助谷歌更新后的 Antigravity 平台来统筹协调各类 AI 智能体。它深度集成于谷歌旗下用户日常使用的产品生态,包括 Gmail、Docs、Slides 等,能够帮助用户查找信息、理解上下文、学习个性化日常习惯,并协助用户快速掌握最新动态。
Spark 最大的特点在于,即便用户离开电脑或手机,它仍会在后台持续运行。用户可以将其配置为一名数字秘书,由其接手复杂任务,例如整理收件箱、搜索信息,以及关注那些容易被淹没在信息洪流中的内容。
通过 Spark,用户可以设置触发条件,例如监控信用卡账单以提醒新增订阅费用或隐性收费。用户还可以指派智能体监视收件箱,持续跟踪工作或生活中的最新动态,帮助用户掌握同事动向、重要截止日期,或生成每日摘要,让用户专注于手头工作。
Spark 甚至能够跨邮件和聊天记录整合会议原始笔记,自动生成包含相关内容的 Docs 文档,并在启动新项目时起草配套邮件,帮助用户始终掌握全局。
谷歌表示,Spark 目前仅接入谷歌自身生态,但即将推出第三方连接器支持。Canva、OpenTable 和 Instacart 的模型上下文协议(MCP)接入今日正式上线,谷歌还表示未来数周内将宣布更多第三方合作伙伴。
此外,Spark 还规划了多项新功能,包括通过短信和邮件与 Spark 交互、创建自定义子智能体,以及操控本地浏览器等能力。
由于 Spark 是一款功能强大的智能体助手,谷歌强调用户将始终保持完全控制权。用户可自主决定何时开启、授权哪些应用接入,而涉及消费或发送邮件等高风险操作,系统也会在执行前主动征求用户确认。
Gemini 应用迎来全面焕新
谷歌对 Gemini 应用及整体交互体验进行了重新设计,引入名为"Neural Expressive"的新设计语言,融合流畅动画、鲜明色彩与触感反馈,提升了整体直观性。
据谷歌介绍,全新视觉效果以流动感和美观性为核心设计目标,让用户能直观感受到界面正处于"思考"状态,从而提升互动参与感。
Gemini Live 语音对话功能现已直接集成至应用与界面之中。用户可随时在文字与语音之间自由切换——既可以在 Gemini 界面中输入详细问题,也可以随时发起简短的语音对话,并在两种模式间灵活来回切换。
谷歌表示,此次改进将让用户可以按照自己的节奏与 Gemini 交流,根据表达需求自由选择方式,不必担心思路被中断。
为提升回复质量,谷歌还引入了最新模型架构,以更好地理解对话语境。例如,Gemini 将根据情况判断是否需要详细展开,还是给出简短回复,或者融入丰富图像、互动时间轴、带旁白的视频以及动态图表等多种形式。
用户还可选择开启"每日简报"功能。开启后,一个智能体将根据用户的收件箱、日历、搜索记录及其他偏好,为其生成个性化的早间摘要,作为每天信息获取的第一站。该简报不仅仅是简单的内容汇总,还会根据用户的具体目标进行整理和优先级排序,甚至给出即时的下一步行动建议。用户也可通过点赞或点踩快速调整其推送偏好。
谷歌透露,公司对 macOS 版 Gemini 桌面应用有着重要规划,计划将 Spark 引入该应用,使其能够处理桌面本地文件上的复杂任务,其运作方式类似于 Anthropic 的 Claude Cowork,并具备自动化工作能力。
在桌面应用的语音体验方面,谷歌也在持续创新。用户无需在思考时刻意回避"嗯""啊""就是说"等口语词。只需自然说话,Gemini 便会结合屏幕上的上下文内容,将随意流淌的语言转化为精准的草稿,并即时将零散的想法重新整理,在光标所在位置直接呈现用户的真实意图。
全新交互设计今日起面向网页端、Android 及 iOS 同步推出。"每日简报"功能面向谷歌 AI Plus 及以上级别订阅用户开放。macOS 版应用已向全体用户开放下载,Gemini Spark 及新版语音功能预计于今夏上线。Gemini Spark 将于本周率先向可信测试用户开放,下周起以 Beta 版形式向美国地区谷歌 AI Ultra 订阅用户推出。
Q&A
Q1:Gemini Spark 是什么?它能做什么?
A:Gemini Spark 是谷歌推出的全天候 AI 智能体助手,底层采用 Gemini 3.5 Flash 模型。它能够在用户离开设备后继续在后台运行,帮助用户整理收件箱、监控账单、跟踪工作动态、汇总会议笔记并起草邮件等,相当于一名随时待命的数字秘书。
Q2:Gemini Spark 支持哪些第三方应用接入?
A:目前 Gemini Spark 已支持通过模型上下文协议(MCP)接入 Canva、OpenTable 和 Instacart 三个第三方平台,谷歌表示未来数周内还将宣布更多合作伙伴。此外,谷歌还计划为 Spark 增加短信交互、自定义子智能体及本地浏览器操控等新功能。
Q3:Gemini Spark 什么时候可以使用?向哪些用户开放?
A:Gemini Spark 将于发布当周率先向可信测试用户开放,下周起以 Beta 版形式向美国地区谷歌 AI Ultra 订阅用户推出。macOS 桌面端的 Spark 功能及新版语音特性计划于今年夏季上线。"每日简报"功能则面向谷歌 AI Plus 及以上级别订阅用户开放。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。