谷歌在今年4月推出MacOS版Gemini应用后,日前又在谷歌I/O 2026开发者大会上宣布,将于今后几个月内为该MacOS应用带来语音功能,以及最新发布的爪形自主AI智能体——Gemini Spark。
在位于加利福尼亚州山景城的谷歌总部举办的谷歌I/O大会上,谷歌实验室、Gemini应用及AI Studio副总裁乔什·伍德沃德现场演示了这一功能。他以上传至MacBook的宠物相关文件为例,包括疫苗接种记录和过敏清单等,展示了如何长按功能键,并通过语音向AI智能体发出指令。
演示过程中可以看到,用户不仅能通过语音指示Gemini根据所选文件起草一封邮件(还可要求语气"友好"),同时还能要求Gemini将选中的文件整理成表格。松开功能键后,Gemini便会依据多条语音指令逐一执行。
伍德沃德介绍道:"由于我在访达中选定了这些文件,Gemini凭借其多模态理解能力,可以读取PDF、识别发票图片,整个过程完全由语音控制,能够处理所有复杂信息,并直接生成内嵌表格。"
用户可前往gemini.google/mac下载MacOS版Gemini应用,并通过快捷键快速启动。在MacBook上,随时按下Option加空格键即可唤起Gemini。目前该应用已支持Nano Banana图像生成等多项核心功能。
尽管大多数用户习惯通过手机或网页端使用AI聊天工具,但为桌面操作系统开发原生应用已成为一个新兴趋势。考虑到Gemini即将为苹果重新设计的AI版Siri提供底层支持,MacBook同步接入Gemini也在情理之中。
Gemini语音功能与Gemini Spark预计将于今年夏天正式登陆MacOS平台。
Q&A
Q1:MacOS版Gemini应用的语音功能怎么使用?
A:在MacBook上,用户只需长按功能键,即可通过语音向Gemini发出指令。例如,可以选中访达中的多个文件,然后语音要求Gemini起草相关邮件或将文件整理成表格。松开功能键后,Gemini会同时处理多条语音指令并执行。整个过程支持多模态理解,可读取PDF和图片等多种格式的文件。
Q2:Gemini Spark是什么?
A:Gemini Spark是谷歌在I/O 2026大会上最新发布的自主AI智能体,被描述为具有"爪形"交互特性的自主AI助手。它将随Gemini语音功能一同于今年夏天登陆MacOS平台,进一步扩展Gemini在桌面端的能力边界。
Q3:如何在MacBook上下载和启动Gemini应用?
A:用户可以访问gemini.google/mac下载MacOS版Gemini应用。安装后,在MacBook上随时按下Option加空格键即可快速唤起Gemini。目前该应用已支持Nano Banana图像生成等功能,语音功能和Gemini Spark将在今年夏天上线。
好文章,需要你的鼓励
当前关于AI究竟是在创造还是消灭就业岗位,各方信号相互矛盾。分析师和行业专家认为,现实情况更为复杂:因AI而消失的岗位很可能在其他地方重新出现,尤其是对具备AI实践经验的人才而言。虽然AI正在重塑劳动力市场,但并未消除对人才的需求。入门级岗位面临压力,但雇主的期望已转向要求候选人具备AI实际操作能力。领英预测,AI已在全球创造了130万个新岗位。
上海AI实验室等机构推出WildClawBench,含60个真实长周期任务,测试AI智能体在真实环境中使用工具完成复杂任务的能力,最强模型仅得62.2%。
初创公司Bolt Graphics推出Zeus GPU,声称路径追踪性能是英伟达RTX 5090的五倍,功耗仅250W,远低于5090的575W。Zeus基于台积电12nm工艺制造,预计2027年第四季度量产。该卡支持384GB内存及原生400GbE/800GbE以太网接口,同时面向高性能计算市场,FP64性能可达20 TFLOPs,电磁波仿真速度据称比英伟达B200快300倍。
武汉大学等机构揭示AI记忆系统的关键盲区:当新信息隐式推翻旧记忆时,当前最强模型总体正确率仅55%,并提出写入时主动裁决旧状态的改进方案。