谷歌正在推出其自己的智能体平台,对标今年早些时候引发行业关注的OpenClaw。在2026年谷歌I/O大会上,谷歌正式发布了Gemini Spark——一款全天候运行的AI智能体,能够自动撰写邮件、创建持续更新的学习资料、监控信用卡账单中隐藏的订阅费用,以及完成更多任务。
Gemini Spark由全新推出的Gemini 3.5 Flash驱动,借助谷歌云上的虚拟机实现24小时不间断后台运行。该AI智能体将与Gmail、Docs、Sheets、Slides等Workspace应用深度集成,同时谷歌还通过模型上下文协议(MCP)这一开放标准,将集成范围拓展至Canva、OpenTable、Instacart等第三方应用,使AI模型能够接入外部系统或数据。
今年夏天,谷歌将赋予Spark通过macOS版Gemini应用访问本地文件的能力。谷歌实验室、Gemini与AI Studio副总裁Josh Woodward在发布简报中表示:"即使你合上笔记本或关闭手机,Spark也能在你日常生活中持续在后台工作。用起来感觉就像随手把任务抛出去,Spark接住它,然后把事情搞定。"
谷歌还计划允许用户通过短信和邮件直接与Spark互动,这与OpenClaw用户通过即时通讯工具与个人智能体对话的方式颇为相似。Gemini Spark未来还将接入Chrome浏览器,并允许用户通过即将推出的全新UI空间"Android Halo"查看实时动态更新。
据谷歌介绍,Spark将"在用户的指令下"运行,用户可以自主控制其连接范围及开关时机。在执行"高风险操作"(如付款或发送邮件)前,系统也会提前征得用户授权。Gemini Spark本周将向"受信任的测试用户"开放,并于下周面向美国地区的Google AI Ultra订阅用户进入公测阶段。
除Gemini 3.5 Flash外,Spark还将结合谷歌的AI编程工具Antigravity使用,后者同样迎来了重大更新。谷歌推出了全新的Antigravity桌面应用,作为管理AI驱动智能体及其任务的统一中心,同时还发布了新的Antigravity命令行界面,以及供开发者构建自有AI工具的软件开发工具包。
Q&A
Q1:Gemini Spark是什么,它能做哪些事情?
A:Gemini Spark是谷歌在2026年I/O大会上发布的全天候AI智能体,由Gemini 3.5 Flash驱动,运行在谷歌云虚拟机上。它可以自动撰写邮件、生成持续更新的学习资料、监控信用卡账单中的隐藏订阅费用,并与Gmail、Docs、Sheets等Workspace应用及Canva、Instacart等第三方应用集成,即使用户关闭设备也能在后台持续工作。
Q2:Gemini Spark如何保障用户的数据安全和操作权限?
A:Gemini Spark采用"在用户指令下运行"的原则,用户可以自主控制其连接范围和开关状态。在执行付款、发送邮件等高风险操作之前,系统会主动向用户请求授权,确保用户对智能体的行为保持掌控。
Q3:Gemini Spark目前向哪些用户开放,如何体验?
A:Gemini Spark本周率先向"受信任的测试用户"开放,下周将面向美国地区的Google AI Ultra订阅用户进入公测阶段。未来还计划支持用户通过短信和邮件直接与Spark互动,并接入Chrome浏览器及"Android Halo"界面。
好文章,需要你的鼓励
Anthropic首次将其最强AI模型向普通用户开放,但设有严格安全限制。Claude Fable 5在软件工程、知识工作和视觉任务方面表现突出,但在网络安全、生物、化学等高风险领域会自动屏蔽响应并回退至Claude Opus 4.8。该模型通过API和企业计划提供访问,定价为每百万输入令牌10美元、输出令牌50美元。Anthropic同时要求对所有流量保留30天数据,以防范新型越狱攻击。
香港科技大学等机构构建SpatialAct基准,测试视觉语言模型能否在3D场景中将空间理解转化为可靠行动,揭示AI存在显著的推理与行动鸿沟。
根据Salesforce与YouGov联合调查,美国工人比全球平均水平高出43%成为AI怀疑者,超过半数美国工人对AI持怀疑态度。与印度、泰国等新兴经济体80%以上的AI信任度相比,美国仅约50%。原因不仅在于担忧失业,还包括AI工具输出质量差、培训不足及数据基础薄弱等问题。研究显示,成功的AI应用需要高质量数据、员工培训与实验文化的共同支撑。
这项研究发现AI统一多模态模型中存在显著"模态鸿沟":文字知识编辑成功率高达92%,但图像生成验证准确率最高仅18.5%,并提出推理增强方法改善跨模态知识传递。