几个月前,Google 为其 Gemini AI 聊天机器人添加了推理模式功能。现在,随着 Google 加倍注重上下文响应,Gemini 2.0 闪电思维实验版的功能范围进一步扩展到聊天体验的其他方面。
公司宣布将使 Gemini 变得更加个性化、互联和实用。同时,也将其互联网信息搜索功能 Deep Research 向更多 Gemini 用户开放。
Deep Research 现在将由 Gemini 2.0 闪电思维实验版提供支持。Google 在博客文章中表示,通过增加闪电思维的能力,Deep Research 现在可以让用户"实时了解它是如何解决研究任务的"。公司表示,这种组合将通过提供更多细节和见解来提高 Deep Research 报告的质量。
在此次更新之前,Gemini 1.5 Pro 为 Deep Research 提供支持,且仅适用于每月 20 美元的 Google One AI Premium 计划用户。然而,VentureBeat 的 Carl Franzen 发现即使是这个相对较弱的版本也是一个有用的研究助手。
更个性化的 Gemini
Gemini 2.0 闪电思维实验版还将支持一项名为个性化的新功能。
个性化功能顾名思义:通过引用之前的对话或搜索,响应将更加贴合用户需求。为了实现这种程度的个性化,Gemini 将连接到用户的 Google 应用和服务,包括搜索和照片。Google 强调,只有在得到许可的情况下才会使用来自 Google 应用的信息。
Gemini 应用产品管理高级总监 Dave Citron 在博客文章中表示:"在未来几个月中,Gemini 将通过连接其他 Google 应用和服务(包括照片和 YouTube)来扩展其对你的理解能力。这将使 Gemini 能够提供更个性化的见解,从更广泛地了解你的活动和偏好中获取信息,提供真正与你产生共鸣的回应。"
由于 Gemini 2.0 闪电思维实验版已集成到个性化功能中,用户可以看到模型在回答查询或完成请求时所使用的数据源概况。
Gemini Advanced 用户可以切换他们希望聊天机器人记住的其他偏好,比如指示它参考过去的对话或提醒它饮食限制。这使 Gemini 能够提供更自然和相关的回应。
当然,Google 并不是唯一认识到个性化和相关响应重要性的公司。去年 11 月,Anthropic 推出了其 Styles 功能,允许用户自定义 Claude 与他们交谈的方式。
更多互联应用
由于个性化需要访问更多用户数据,可以将其视为面向 Gemini 用户而非整个组织的 RAG,Google 将更多服务连接到 Gemini 2.0 闪电思维实验版。
该模型可以访问日历、笔记、任务和照片等应用。
Citron 表示:"通过这种思维模型,Gemini 可以更好地处理复杂请求,比如涉及多个应用的提示,因为新模型可以更好地推理整体请求,将其分解为不同步骤,并在过程中评估自身进度。"
Google 表示,在几周内,Gemini 将能够查看 Google 相册中的照片,并根据用户的图片回答问题。它可以根据最近旅行的照片制定旅行计划,并回忆诸如驾驶证到期日期等信息,或者你是否在商店拍过牛奶的照片。
集成应用程序以为聊天机器人响应提供更多上下文一直是 AI 公司的一大趋势。在企业领域,这表现为让聊天机器人访问开发环境或电子邮件。ChatGPT 可以打开大多数 IDE,因此开发人员可以从 VSCode 中带入他们的代码并向 ChatGPT 查询相关问题。Google 的编码助手 Code Assist 也连接到 IDE。
Google 不断增加的应用程序和服务集成以及 Gemini 的个性化突显了上下文和数据在使这些聊天机器人更有用方面的重要性,即使查询仅仅是询问餐厅推荐。
好文章,需要你的鼓励
2025年底,OpenAI发布了一份名为《企业AI现状》的年度报告,这份报告汇集了超过100万家企业客户的使用数据,以及近9000名员工的调研反馈。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
迪士尼与OpenAI达成三年合作协议,授权200多个迪士尼、皮克斯、漫威和星球大战角色用于Sora视频和ChatGPT图像生成。迪士尼将向OpenAI投资10亿美元股权,成为其主要客户。协议明确不包含真人演员肖像和声音授权,仅限动画版本角色。同时迪士尼向谷歌发出停止侵权通知,要求停止基于其IP生成内容。这标志着娱乐巨头积极拥抱AI技术变革。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。