几个月前,Google 为其 Gemini AI 聊天机器人添加了推理模式功能。现在,随着 Google 加倍注重上下文响应,Gemini 2.0 闪电思维实验版的功能范围进一步扩展到聊天体验的其他方面。
公司宣布将使 Gemini 变得更加个性化、互联和实用。同时,也将其互联网信息搜索功能 Deep Research 向更多 Gemini 用户开放。
Deep Research 现在将由 Gemini 2.0 闪电思维实验版提供支持。Google 在博客文章中表示,通过增加闪电思维的能力,Deep Research 现在可以让用户"实时了解它是如何解决研究任务的"。公司表示,这种组合将通过提供更多细节和见解来提高 Deep Research 报告的质量。
在此次更新之前,Gemini 1.5 Pro 为 Deep Research 提供支持,且仅适用于每月 20 美元的 Google One AI Premium 计划用户。然而,VentureBeat 的 Carl Franzen 发现即使是这个相对较弱的版本也是一个有用的研究助手。
更个性化的 Gemini
Gemini 2.0 闪电思维实验版还将支持一项名为个性化的新功能。
个性化功能顾名思义:通过引用之前的对话或搜索,响应将更加贴合用户需求。为了实现这种程度的个性化,Gemini 将连接到用户的 Google 应用和服务,包括搜索和照片。Google 强调,只有在得到许可的情况下才会使用来自 Google 应用的信息。
Gemini 应用产品管理高级总监 Dave Citron 在博客文章中表示:"在未来几个月中,Gemini 将通过连接其他 Google 应用和服务(包括照片和 YouTube)来扩展其对你的理解能力。这将使 Gemini 能够提供更个性化的见解,从更广泛地了解你的活动和偏好中获取信息,提供真正与你产生共鸣的回应。"
由于 Gemini 2.0 闪电思维实验版已集成到个性化功能中,用户可以看到模型在回答查询或完成请求时所使用的数据源概况。
Gemini Advanced 用户可以切换他们希望聊天机器人记住的其他偏好,比如指示它参考过去的对话或提醒它饮食限制。这使 Gemini 能够提供更自然和相关的回应。
当然,Google 并不是唯一认识到个性化和相关响应重要性的公司。去年 11 月,Anthropic 推出了其 Styles 功能,允许用户自定义 Claude 与他们交谈的方式。
更多互联应用
由于个性化需要访问更多用户数据,可以将其视为面向 Gemini 用户而非整个组织的 RAG,Google 将更多服务连接到 Gemini 2.0 闪电思维实验版。
该模型可以访问日历、笔记、任务和照片等应用。
Citron 表示:"通过这种思维模型,Gemini 可以更好地处理复杂请求,比如涉及多个应用的提示,因为新模型可以更好地推理整体请求,将其分解为不同步骤,并在过程中评估自身进度。"
Google 表示,在几周内,Gemini 将能够查看 Google 相册中的照片,并根据用户的图片回答问题。它可以根据最近旅行的照片制定旅行计划,并回忆诸如驾驶证到期日期等信息,或者你是否在商店拍过牛奶的照片。
集成应用程序以为聊天机器人响应提供更多上下文一直是 AI 公司的一大趋势。在企业领域,这表现为让聊天机器人访问开发环境或电子邮件。ChatGPT 可以打开大多数 IDE,因此开发人员可以从 VSCode 中带入他们的代码并向 ChatGPT 查询相关问题。Google 的编码助手 Code Assist 也连接到 IDE。
Google 不断增加的应用程序和服务集成以及 Gemini 的个性化突显了上下文和数据在使这些聊天机器人更有用方面的重要性,即使查询仅仅是询问餐厅推荐。
好文章,需要你的鼓励
存储扩展专家Lucidity将其AutoScaler平台扩展至Kubernetes容器编排平台,帮助企业控制存储支出。该公司表示,Kubernetes中的持久卷常常成为隐形浪费源,虽然Kubernetes可自动扩展实例数量,但底层存储通常未被充分利用。新服务可为亚马逊EKS提供持久卷的自动扩缩容,声称可为客户节省高达70%的云块存储费用。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
超过1.8万Spotify用户加入名为"Unwrapped"的集体组织,通过去中心化数据平台Vana将个人听歌数据打包出售给AI开发者。该组织已将1万用户的艺术家偏好数据以5.5万美元价格售出,用于构建新型流媒体数据分析工具。Spotify对此发出警告,称该行为违反开发者政策和商标权,禁止将平台数据用于机器学习模型构建。但Unwrapped团队坚持用户拥有控制和变现个人数据的权利,双方就数据所有权展开争议。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。