谷歌表示,Gemini 现在可以使用搜索历史来为其响应提供参考,并补充说该聊天机器人在未来几个月内将获得对 YouTube 和 Photos 等其他平台的访问权限。用户需要授权 Gemini 引用搜索历史记录,并可以随时断开连接。
谷歌表示:"只有当我们的高级推理模型确定搜索历史确实有帮助时,我们才会使用它。"同时补充说他们将继续收集早期测试者的反馈。
个性化功能可以通过 Gemini 的模型下拉菜单找到。谷歌表示,在用户输入提示后,"它将分析提示并确定您的搜索历史是否可以增强响应效果"。
从周四开始,Gemini 和 Gemini Advanced 订阅用户可以通过网页访问这项实验性的个性化功能,该功能也正在移动端推出。支持个性化的 Gemini 将在谷歌运营的大多数国家以超过 40 种语言提供服务。
该聊天机器人由谷歌上个月在其 Gemini 应用程序中推出的 Gemini 2.0 Flash Thinking Experimental 模型驱动。该模型经过训练,通过逐步分解提示并向用户展示其"思考过程"来"加强其推理能力",让用户了解它是如何得出响应的。去年 12 月,谷歌推出了 Gemini 2.0,谷歌首席执行官桑达尔·皮查伊表示,这"将使我们能够构建新的 AI 代理,让我们更接近通用助手的愿景"。
谷歌还在周四表示,它将为 2.0 Flash Thinking Experimental 模型提供更长的上下文窗口以处理更大量的信息,并增加上传文件等新功能。该公司还表示正在用该模型升级其 Deep Research 功能。这项功能将向普通 Gemini 用户免费开放,可以在浏览数百个网页后在几分钟内编制多页研究报告。
Gemini 应用程序还将获得谷歌的 Gems 功能,现在所有用户都可以免费构建自己的个人 AI 专家,涵盖语言和数学等主题。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。