Google 已决定终止其语音助手 Assistant 服务,并用 Gemini AI 服务取而代之。
Google Assistant 于 2016 年首次亮相,提供了 Google 所称的"对话式界面",可以"享受娱乐、管理日常任务并从 Google 获得答案"。
要使用 Assistant 的服务,用户需要点击图标或说出唤醒语"OK Google",然后说出指令。这个工具被集成在 Android 和许多 Google 服务中。Google 还将其助手内置到智能音箱和智能家居设备中,并允许第三方硬件制造商也这样做。
开发者被吸引来通过"Actions"功能让 Assistant 执行自定义任务。
为了说明 Actions 的功能,Google 举例一个名为"Heavy Metal Detector"的假想网站,该网站为重金属音乐爱好者提供演出指南和新闻。Google 建议该网站的运营者可以构建一个 Action,允许用户说出类似"OK, Google. 跟 Heavy Metal Detector 聊聊,帮我找重金属音乐会"这样的指令。
遗憾的是,Assistant 的表现并不理想。根据记者的体验,它经常难以正确理解上述查询重金属演出的请求。而且远处房间的智能音箱对指令的响应可能与近在咫尺的设备一样。
2022 年,我们的专栏作家 Mark Pesce 认为整个语音助手类别都已失败,因为没有人会用它们做播放音乐和倒计时以外的事情。
2023 年,Google 停止了 Actions 服务,这似乎印证了 Mark 的观点。
现在 Google 似乎也厌倦了 Assistant,周五的一篇博文宣布它将被 Google 闪亮的新生成式 AI 产品 Gemini 取代。
"在未来几个月,我们将把更多移动设备用户从 Google Assistant 升级到 Gemini;到今年晚些时候,传统的 Google Assistant 将在大多数移动设备上不再可用,"Gemini 应用产品管理高级总监 Brian Marquardt 写道。
"此外,我们还将把平板电脑、汽车和连接到手机的设备 (如耳机和手表) 升级到 Gemini,"他补充说。
Marquardt 还承诺"将为智能音箱、显示器和电视等家用设备提供由 Gemini 驱动的新体验",详细信息将在"未来几个月内"公布。
Marquardt 的文章没有详细介绍这种新体验,但开篇就指出:"我们相信助手应该是个性化的,能够感知周围的世界。它应该能够与你已经使用的应用和服务交互。它应该让你变得更有效率、更有创造力,并激发你的好奇心。"
值得注意的是,Gemini 可能会让你的花费增加,因为全面采用 Google AI 的三星最新 Galaxy S 智能手机已经警告买家,他们可能需要订阅才能访问合作伙伴提供的 AI 功能。截至 2025 年 1 月,这家韩国巨头表示 AI 订阅至少要在一年后才会推出...这将是在 Google Assistant 退役几个月之后。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。