几个月前,Google 为其 Gemini AI 聊天机器人添加了推理模式功能。现在,随着 Google 加倍注重上下文响应,Gemini 2.0 闪电思维实验版的功能范围进一步扩展到聊天体验的其他方面。
公司宣布将使 Gemini 变得更加个性化、互联和实用。同时,也将其互联网信息搜索功能 Deep Research 向更多 Gemini 用户开放。
Deep Research 现在将由 Gemini 2.0 闪电思维实验版提供支持。Google 在博客文章中表示,通过增加闪电思维的能力,Deep Research 现在可以让用户"实时了解它是如何解决研究任务的"。公司表示,这种组合将通过提供更多细节和见解来提高 Deep Research 报告的质量。
在此次更新之前,Gemini 1.5 Pro 为 Deep Research 提供支持,且仅适用于每月 20 美元的 Google One AI Premium 计划用户。然而,VentureBeat 的 Carl Franzen 发现即使是这个相对较弱的版本也是一个有用的研究助手。
更个性化的 Gemini
Gemini 2.0 闪电思维实验版还将支持一项名为个性化的新功能。
个性化功能顾名思义:通过引用之前的对话或搜索,响应将更加贴合用户需求。为了实现这种程度的个性化,Gemini 将连接到用户的 Google 应用和服务,包括搜索和照片。Google 强调,只有在得到许可的情况下才会使用来自 Google 应用的信息。
Gemini 应用产品管理高级总监 Dave Citron 在博客文章中表示:"在未来几个月中,Gemini 将通过连接其他 Google 应用和服务(包括照片和 YouTube)来扩展其对你的理解能力。这将使 Gemini 能够提供更个性化的见解,从更广泛地了解你的活动和偏好中获取信息,提供真正与你产生共鸣的回应。"
由于 Gemini 2.0 闪电思维实验版已集成到个性化功能中,用户可以看到模型在回答查询或完成请求时所使用的数据源概况。
Gemini Advanced 用户可以切换他们希望聊天机器人记住的其他偏好,比如指示它参考过去的对话或提醒它饮食限制。这使 Gemini 能够提供更自然和相关的回应。
当然,Google 并不是唯一认识到个性化和相关响应重要性的公司。去年 11 月,Anthropic 推出了其 Styles 功能,允许用户自定义 Claude 与他们交谈的方式。
更多互联应用
由于个性化需要访问更多用户数据,可以将其视为面向 Gemini 用户而非整个组织的 RAG,Google 将更多服务连接到 Gemini 2.0 闪电思维实验版。
该模型可以访问日历、笔记、任务和照片等应用。
Citron 表示:"通过这种思维模型,Gemini 可以更好地处理复杂请求,比如涉及多个应用的提示,因为新模型可以更好地推理整体请求,将其分解为不同步骤,并在过程中评估自身进度。"
Google 表示,在几周内,Gemini 将能够查看 Google 相册中的照片,并根据用户的图片回答问题。它可以根据最近旅行的照片制定旅行计划,并回忆诸如驾驶证到期日期等信息,或者你是否在商店拍过牛奶的照片。
集成应用程序以为聊天机器人响应提供更多上下文一直是 AI 公司的一大趋势。在企业领域,这表现为让聊天机器人访问开发环境或电子邮件。ChatGPT 可以打开大多数 IDE,因此开发人员可以从 VSCode 中带入他们的代码并向 ChatGPT 查询相关问题。Google 的编码助手 Code Assist 也连接到 IDE。
Google 不断增加的应用程序和服务集成以及 Gemini 的个性化突显了上下文和数据在使这些聊天机器人更有用方面的重要性,即使查询仅仅是询问餐厅推荐。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
浙江大学等高校研究团队开发的VolSplat系统,通过"体素对齐"替代传统"像素对齐"方法,实现了快速高质量的3D场景重建。该技术仅需6张普通照片即可生成精确3D模型,在RealEstate10K等标准数据集上显著超越现有方法,为机器人导航、增强现实、建筑设计等领域提供了新的技术选择,代表了3D重建领域从二维思维向三维思维的重要转变。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
武汉大学团队与字节跳动公司合作,提出MAPO混合优势策略优化方法,解决AI训练中的"一刀切"问题。该方法能根据问题难度动态调整评分策略,避免传统方法中的优势反转和优势镜像问题。通过轨迹确定性判断和权重动态调整,在几何推理和情感识别任务上都取得显著提升,为AI自适应学习提供新思路。