在众多 AI 公司纷纷推出聊天机器人的背景下,Google 正在利用其最大的竞争优势 —— 搜索引擎,来让 Gemini 脱颖而出。启用个性化功能后,Gemini 现在可以自动分析用户的查询,判断是否可以通过参考搜索历史来"增强"其回答质量。
该功能由 Gemini 2.0 Flash Thinking Experimental 模型提供支持,只有当 AI 模型认为"有帮助"时才会引用你的搜索结果。例如,当你向 Gemini 询问餐厅或旅行建议时,聊天机器人会参考你最近与美食相关的搜索记录来提供建议。
将搜索历史与 Gemini 关联是可选的。
这是 Google 正在推出的更广泛个性化功能的一部分。该功能最终将把 Gemini 与 YouTube 和 Google Photos 等其他应用程序连接起来,使聊天机器人能够"通过更全面地了解你的活动和偏好,提供更个性化的见解"。
Google 指出,你可以随时断开 Gemini 与搜索历史的连接。当你收到回答时,你会看到 Gemini 如何得出答案的概述,以及它是否参考了你的保存信息、过往对话或搜索历史。系统还会显示一个"清晰的横幅",提供断开搜索历史连接的链接。
Gemini 在提供旅行建议时可能会使用你的搜索历史。
Web 端的 Gemini 和 Gemini Advanced 用户可以通过在模型下拉菜单中选择"个性化 (实验性)"来启用该功能。该功能正在逐步在移动端推出,并在"大多数"国家以超过 40 种语言提供服务。
Google 还发布了其他更新,包括允许所有 Gemini 用户免费创建自己的个人 AI 助手 —— 称为 Gems。公司还宣布将其 Gemini 2.0 Flash Thinking Experimental 模型引入 Deep Research 功能,据称这将提升聊天机器人"在所有研究阶段"的能力。
Gemini 与日历、记事本、任务和照片的集成也升级到了 Gemini 2.0 Flash Thinking Experimental 模型,加入了 YouTube、搜索和 Google Maps 的行列。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。