我在电脑上工作时,经常需要借助谷歌Gemini来获取AI辅助。但每次使用都要打开Gemini网站,然后在网站和工作内容之间来回切换,十分繁琐。如果能在不离开桌面的情况下直接使用Gemini就好了。现在,这个愿望终于实现了——谷歌推出了专属的Mac桌面应用。
谷歌正式发布了Gemini Mac桌面应用。用户可以通过图标点击或键盘快捷键快速启动,该应用将网页版的全部功能和特性带到了桌面端。更进一步的是,用户还可以将Mac上任意已打开的应用或窗口共享给Gemini,让它对内容进行摘要整理或回答相关问题。
借助这款新的Mac应用,Gemini也在追赶ChatGPT、Microsoft Copilot、Claude AI和Perplexity的步伐——这些AI助手均已推出桌面应用版本。主要区别在于,其他AI的桌面应用同时支持Windows和Mac系统,而Gemini应用目前仅支持Mac平台。
使用前提条件
要开始使用,你需要一台搭载Apple芯片(M1或更高版本)的Mac,以及macOS Sequoia 15或更高版本的系统。前往Gemini Mac应用页面点击下载按钮即可。应用打开后,系统会提示你使用谷歌账号登录,之后的使用方式与网页版Gemini基本相同。
日后启动应用时,你可以从"应用程序"文件夹打开,或将其添加到Dock栏。当然,也可以尝试使用键盘快捷键。默认情况下,按下Option + Shift + Space可在全屏窗口中打开应用,仅按Option + Space则会启动迷你聊天窗口。两个快捷键均可在"设置"中自定义修改。
功能使用详解
在应用中点击侧边栏,可以开始新的对话,或从历史记录中查看以往的聊天内容。根据你的Gemini订阅套餐,可以选择不同的使用模式——快速模式、思考模式或Pro模式。之后,你可以通过文字输入或语音来提出请求。
点击输入框旁的加号图标,可以添加并分析来自Mac本地、Google Drive或Google相册中的文件或图片。用户还可以调用谷歌的NotebookLM和Canvas工具,以及让AI生成图片、视频或音乐内容。
最受期待的功能:窗口共享
让我更倾向于使用应用而非网页版的核心原因,正是窗口共享功能。当你需要对Mac上某个应用、文件、网页或其他窗口的内容寻求帮助时,直接通过应用向Gemini提问即可。
设置方法如下:点击加号图标,选择"共享窗口"。首次使用时需要授予Gemini相应的系统权限。完成授权后,再次点击加号图标,选择"共享窗口",然后选择你希望共享的窗口。
关于隐私方面,向谷歌共享任何个人信息都需要谨慎,这一点完全可以理解。但在这个功能中,你可以自主控制共享哪个窗口。同时建议避免共享任何敏感或机密内容。
实测体验
在实际测试中,我通过相册应用共享了一张照片,并让Gemini识别照片中的一座雕像。Gemini正确识别出这是位于华盛顿特区的林肯纪念堂中的亚伯拉罕·林肯雕像,并提供了一些相关的历史背景介绍。
总体而言,我对这款新的Gemini应用印象不错,今后会在Mac上持续使用。不过,Windows仍然是我的主力平台。如果希望在Windows上体验类似功能,谷歌推出的Windows版应用同样支持共享整个桌面或特定窗口,并可就内容进行提问。
Q&A
Q1:Gemini Mac桌面应用需要什么系统配置才能使用?
A:使用Gemini Mac桌面应用需要一台搭载Apple芯片(M1或更高版本)的Mac电脑,同时系统版本需为macOS Sequoia 15或更高版本。满足条件后,前往Gemini Mac应用页面点击下载按钮,使用谷歌账号登录即可开始使用。
Q2:Gemini Mac应用的窗口共享功能怎么用?
A:在Gemini Mac应用中,点击输入框旁的加号图标,选择"共享窗口"选项。首次使用时需授予系统权限,完成后重复操作并选择要共享的窗口,即可让Gemini对该窗口内容进行分析、摘要或回答相关问题。建议不要共享涉及隐私或机密的内容。
Q3:Gemini Mac应用和Gemini网页版有什么区别?
A:Gemini Mac应用在保留网页版全部功能的基础上,新增了窗口共享功能,可将Mac上任意打开的应用或窗口共享给Gemini进行分析。此外,应用支持键盘快捷键快速启动,使用更便捷。目前该应用仅支持Mac平台,Windows版本尚未推出。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。