Microsoft 在其 50 周年之际宣布了一系列新的 Copilot 功能,这些功能对于使用过竞争对手 AI 平台的用户来说可能会感到异常熟悉。
Microsoft AI 负责人 Mustafa Suleyman 写道:"今天,我们正在开启将 Copilot 从一个 AI 助手转变为你的专属 AI 助手的旅程。"
这一转变包括为聊天机器人添加记忆功能 (需要用户许可),使其能够"了解你生活中的细节"。这无疑能提高响应质量,但同时也让人觉得有些不安。
当我们询问 Microsoft 这是否为可选功能时,一位发言人告诉 The Register:"如果个性化功能可用,Copilot 将记住关于你的关键信息,并提供量身定制的 Copilot 体验。如果你不再希望 Copilot 通过记忆功能记住有关你的信息,可以随时选择退出个性化服务。"
OpenAI 在 2024 年为 ChatGPT 添加了记忆功能。
其他更新包括购物功能,可以通过"实时可信商家目录"找到最优惠的交易,以及 Actions 功能,使 Copilot 能够为用户完成任务。Suleyman 举例说明,从"订演唱会门票到安排回家的交通"都可以实现。Actions 功能可以与 OpenAI 的 Operator 功能相媲美。
另一个让人产生似曾相识感的是 Deep Research 功能的推出,它将允许用户"更高效地进行复杂的多步骤研究任务...节省时间并无缝处理复杂任务"。
这听起来很像 OpenAI 的 Deep Research 或 Google Gemini Deep Research。
Copilot Vision 将记忆功能的不安感提升到了新的高度。Android 和 iOS 的移动应用版本将会很有帮助——它们可以识别手机相机视野内的物品并回答相关问题,或使用相册中的照片。
相比之下,同样使用 Copilot Vision 品牌的 Windows 原生桌面版本则显得更令人不安。
据 Microsoft 称,"它将读取屏幕并与内容互动。" Copilot 将能够更改设置、组织文件并协作项目。Windows 预览体验计划的用户将首先体验到这个聊天机器人的功能,而就在上周,这个机器人还认为半个世纪只有 25 年。
Microsoft 发言人告诉 The Register,虽然内容会被传输到公司的云端进行 AI 计算,但"Vision 会话和文件搜索的内容不会用于模型训练或广告个性化。"
此外,"分享给 Copilot Vision 的截图、音频和上下文信息不会被 Copilot 存储。"然而,与 Copilot 的语音对话记录会作为对话历史的一部分被存储,但"可以随时删除"。
接下来是 Pages 功能,它将笔记和研究整合到由 Copilot 组织的"画布"中 (听起来类似于去年的 ChatGPT Canvas),以及 Podcasts 功能,它将生成"根据你的兴趣策划和提供个性化音频内容"的 AI 播客,有点像 Google NotebookLM 的 Audio Overview 功能。
因为现在世界确实需要更多的播客。
有趣的是,Microsoft 选择在其成立周年之际宣布这些类似于竞争对手平台已有功能的 AI 特性。在上周接受 CNBC 采访时,Suleyman 据报道表示,公司的策略是"紧随其后",在其他公司率先推进 AI 前沿的同时,享受较低的成本并瞄准特定的使用场景。
无论 Microsoft 报道的策略如何,这些公告表明公司仍然完全致力于 Copilot,其客户必须为即将到来的变化做好准备。
好文章,需要你的鼓励
这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实现动态知识获取。实验表明,R1-Searcher++不仅在多步问答任务上表现优异,还大幅减少了检索次数,显著提高了推理效率。
这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结合答案正确性和检索质量双重奖励,该方法在七项问答基准测试中平均提升6.9%的准确率,特别在复杂多跳推理场景中表现突出,解决了现有检索增强推理的核心局限性。
这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑盒模型,更符合现实场景,暴露了当前AI代理面临的实际安全漏洞。实验还表明,即使添加专门的防御提示,这类攻击仍能成功率超过50%,凸显了设计更强大防御机制的紧迫性。
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。