谷歌推出 Mac 原生 Gemini 应用
继将 Gemini 植入自家各类应用和服务之后,谷歌现在还希望用户在桌面端和笔记本电脑上也能使用其 AI 助手。该公司于本周二发布了 Gemini Windows 版应用,并在一天后推出了 Mac 版本。
谷歌表示,macOS 版 Gemini 应用是一款"原生桌面体验"产品,用户可通过键盘快捷键快速唤醒。默认情况下,按下 Option 和空格键将打开迷你对话窗口,而 Option、Shift 加空格键的组合则会打开完整的 Gemini 对话界面。用户可在应用设置中自定义这些快捷键绑定方式。
用户可以将屏幕上的任何内容——包括本地保存的文件——分享给这款聊天机器人,并就所见内容进行提问。支持分享的内容涵盖图片、文档、数据及代码等多种类型。
除当前屏幕内容外,用户还可以将完整网页分享给 Gemini。该应用同时支持图片和视频生成功能,分别由 Imagen 和 Veo 提供技术支持。应用目前适用于运行 macOS 15(即 macOS Sequoia)或更高版本的 Mac 设备,并在所有 Gemini 支持的国家和语言地区提供服务。
"我们正在为打造一款真正个性化、主动式、强大的桌面助手奠定基础,未来几个月将有更多消息分享。"Gemini 应用集团产品经理 Michael Friedman 在博客文章中写道。此番表态颇为耐人寻味——苹果经历长期延迟的生成式 AI 版 Siri 预计将于今年六月的 WWDC 大会上正式亮相,而苹果这款深度整合 macOS 应用的重磅聊天机器人,正是由 Gemini 模型提供底层支持。
Q&A
Q1:Mac 版 Gemini 应用需要什么系统版本才能使用?
A:Mac 版 Gemini 应用要求设备运行 macOS 15(即 macOS Sequoia)或更高版本,并且需要在 Gemini 支持的国家和语言地区使用。
Q2:Mac 版 Gemini 应用的默认快捷键是什么?
A:默认情况下,按下 Option 加空格键可打开迷你对话窗口,按下 Option、Shift 加空格键则会打开完整的 Gemini 对话界面。用户也可以在应用设置中根据自己的习惯自定义这些快捷键组合。
Q3:Mac 版 Gemini 应用支持哪些内容分享和功能?
A:用户可以将屏幕上的任意内容分享给 Gemini,包括图片、文档、数据和代码,也可以分享本地保存的文件,甚至完整的网页内容。此外,该应用还支持图片生成和视频生成功能,分别由 Imagen 和 Veo 提供技术支持。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。