在2026年Google I/O大会上,谷歌预告了Gemini macOS应用即将于今夏推出的两项重要新功能。
谷歌于今年4月推出了原生Mac应用,据悉开发过程中有一支"小团队"借助Antigravity工具参与其中。
Gemini Spark是一款全天候在线的个人AI智能体,能够代替用户执行操作,帮助用户"管理好自己的数字生活"。其功能涵盖与Gmail、Docs及其他Workspace应用的深度集成,同时也支持第三方服务。该功能将于下周向Google AI Ultra订阅用户(每月100美元)开放测试版,适用平台包括Android、iOS版Gemini应用及网页端。
Spark今夏将正式登陆macOS版Gemini,届时用户可以利用它执行"涉及本地文件的任务,并实现跨桌面应用的工作流自动化"。此外,它还将与现有功能无缝衔接——用户可以将任意已打开的窗口内容作为提示词的上下文输入。
全新语音交互体验允许用户随意开口说话,无需担心思考过程中脱口而出的"嗯"或"那什么"等口头语。在Mac上长按功能键后,屏幕底部将出现一个浮动的胶囊形图标;松开按键即可提交提示词,并显示思考动画以呈现处理进度。
Gemini能够结合屏幕上的内容,将用户自由表达的语音转化为精准的文字草稿,并在光标所在位置即时完成格式整理,准确捕捉用户的表达意图。
在本周二的主题演讲中,谷歌现场演示了这样一个场景:先在Finder中选中文件,随后通过语音口述邮件内容,Gemini便自动将内容填入Gmail的邮件撰写窗口。
Q&A
Q1:Gemini Spark智能体具体能帮用户做哪些事情?
A:Gemini Spark是一款全天候在线的个人AI智能体,可以代替用户执行多种操作。它支持与Gmail、Docs等Google Workspace应用深度集成,也能连接第三方服务。在macOS端,Spark还能处理本地文件相关任务,并实现跨桌面应用的工作流自动化,同时支持将已打开的窗口内容作为提示词的上下文,帮助用户更高效地管理数字生活。
Q2:macOS版Gemini的新语音功能怎么使用?
A:在Mac上长按功能键,屏幕底部会出现一个浮动的胶囊形图标,用户可以直接开口说话,无需刻意组织语言,口头语和停顿都不影响使用。松开功能键后,Gemini会自动提交语音内容,并结合当前屏幕上下文,将自由表达的语音转化为精准的文字草稿,直接插入光标所在位置,格式整理也同步完成。
Q3:Gemini Spark什么时候可以用?需要订阅哪个套餐?
A:Gemini Spark将于近期向Google AI Ultra订阅用户开放测试版,该套餐每月收费100美元,支持Android、iOS版Gemini应用及网页端。macOS版本的Spark功能预计在今夏推出,包括本地文件处理和桌面工作流自动化等功能。
好文章,需要你的鼓励
在新加坡ATxSummit科技峰会上,多位AI领域专家与科技领袖发出警告:随着AI系统能力不断增强、评估难度持续上升并深度融入日常生活,AI治理已进入更紧迫的阶段。加州大学伯克利分校教授Stuart Russell警告,若等到重大AI灾难发生才采取行动,将是严重失误。专家们呼吁将治理机制嵌入AI开发全流程,推动政府与产业持续协作,并强调针对自主Agent AI的评估方法亟需创新升级。
VideoSeeker是中科大与小红书联合提出的实例级视频理解系统,通过视觉提示和主动工具调用,让AI能精准理解视频中的特定目标,8B模型超越GPT-4o和Gemini-2.5-Pro。
本文详细介绍了在高通旗下多款硬件平台(包括Arduino UNO Q、Rubik Pi 3及搭载骁龙处理器的PC)上安装并运行OpenClaw和Hermes Agent的完整步骤。文章涵盖依赖环境配置、安装流程、大语言模型集成方法,以及在边缘设备上部署AI智能体的实用技巧,同时提供了数据安全使用建议,适合智能硬件开发者和AI边缘计算爱好者参考。
南京大学团队提出NGM,一种无需训练的即插即用记忆模块,通过复用大模型已有词汇嵌入构建N元记忆并以余弦门控注入,提升代码生成和知识任务性能。