Google正式推出适用于Mac平台的Gemini应用程序,用户无需在多个窗口之间来回切换,即可随时与AI助手进行交互。通过该应用,用户可使用Option + Space快捷键唤出一个悬浮聊天窗口,直接向Gemini提问,并可选择共享当前屏幕窗口内容。
在共享窗口之前,用户需要先授予Gemini访问系统信息的权限。完成授权后,AI助手将从用户当前查看的内容中提取信息,以更准确地回答问题。
该应用的交互方式与苹果升级版Spotlight有几分相似——后者同样支持直接在设备上执行操作,并可接入OpenAI的ChatGPT等AI模型。Mac版Gemini的推出,意味着Google正式加入桌面端AI助手的竞争行列,直面Anthropic、OpenAI和Perplexity的挑战,这些公司都希望将自家聊天机器人打造为桌面设备上的首选AI模型。不过,ChatGPT和Anthropic的Claude Mac版目前在功能上更进一步,两者均支持AI助手代替用户在电脑上执行具体任务,这一点Gemini暂时尚未实现。
与网页版和移动版Gemini一样,Mac客户端同样支持上传文件、照片或Google Drive中的文档,并可使用Gemini生成图片、视频或音乐。用户还可以通过该应用回顾与Google账号关联的历史对话记录。值得一提的是,此次Mac版发布仅在Google面向Windows平台全面开放类Spotlight桌面搜索功能的一天之后。
Gemini Mac版现已免费提供下载,支持所有Gemini已上线的语言与国家/地区,系统要求为macOS Sequoia(15.0)及以上版本。
Q&A
Q1:Mac版Gemini应用怎么唤出来?
A:在Mac上安装Gemini应用后,可以使用Option + Space快捷键随时唤出悬浮聊天窗口,无需切换到应用界面,可以直接提问或共享当前窗口内容,非常方便。
Q2:Mac版Gemini和ChatGPT、Claude相比有什么差距?
A:目前Mac版Gemini尚不支持代替用户在电脑上自主执行任务,而ChatGPT和Anthropic的Claude Mac版已具备这一功能,可以帮用户完成电脑上的具体操作。在文件上传、图片生成、视频和音乐创作等功能上,Gemini与网页版和移动版保持一致。
Q3:Mac版Gemini对系统有什么要求?支持哪些地区?
A:Mac版Gemini要求设备运行macOS Sequoia(15.0)及以上版本,支持所有已开放Gemini服务的语言和国家/地区,可免费下载使用。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。