Microsoft 在其 50 周年之际宣布了一系列新的 Copilot 功能,这些功能对于使用过竞争对手 AI 平台的用户来说可能会感到异常熟悉。
Microsoft AI 负责人 Mustafa Suleyman 写道:"今天,我们正在开启将 Copilot 从一个 AI 助手转变为你的专属 AI 助手的旅程。"
这一转变包括为聊天机器人添加记忆功能 (需要用户许可),使其能够"了解你生活中的细节"。这无疑能提高响应质量,但同时也让人觉得有些不安。
当我们询问 Microsoft 这是否为可选功能时,一位发言人告诉 The Register:"如果个性化功能可用,Copilot 将记住关于你的关键信息,并提供量身定制的 Copilot 体验。如果你不再希望 Copilot 通过记忆功能记住有关你的信息,可以随时选择退出个性化服务。"
OpenAI 在 2024 年为 ChatGPT 添加了记忆功能。
其他更新包括购物功能,可以通过"实时可信商家目录"找到最优惠的交易,以及 Actions 功能,使 Copilot 能够为用户完成任务。Suleyman 举例说明,从"订演唱会门票到安排回家的交通"都可以实现。Actions 功能可以与 OpenAI 的 Operator 功能相媲美。
另一个让人产生似曾相识感的是 Deep Research 功能的推出,它将允许用户"更高效地进行复杂的多步骤研究任务...节省时间并无缝处理复杂任务"。
这听起来很像 OpenAI 的 Deep Research 或 Google Gemini Deep Research。
Copilot Vision 将记忆功能的不安感提升到了新的高度。Android 和 iOS 的移动应用版本将会很有帮助——它们可以识别手机相机视野内的物品并回答相关问题,或使用相册中的照片。
相比之下,同样使用 Copilot Vision 品牌的 Windows 原生桌面版本则显得更令人不安。
据 Microsoft 称,"它将读取屏幕并与内容互动。" Copilot 将能够更改设置、组织文件并协作项目。Windows 预览体验计划的用户将首先体验到这个聊天机器人的功能,而就在上周,这个机器人还认为半个世纪只有 25 年。
Microsoft 发言人告诉 The Register,虽然内容会被传输到公司的云端进行 AI 计算,但"Vision 会话和文件搜索的内容不会用于模型训练或广告个性化。"
此外,"分享给 Copilot Vision 的截图、音频和上下文信息不会被 Copilot 存储。"然而,与 Copilot 的语音对话记录会作为对话历史的一部分被存储,但"可以随时删除"。
接下来是 Pages 功能,它将笔记和研究整合到由 Copilot 组织的"画布"中 (听起来类似于去年的 ChatGPT Canvas),以及 Podcasts 功能,它将生成"根据你的兴趣策划和提供个性化音频内容"的 AI 播客,有点像 Google NotebookLM 的 Audio Overview 功能。
因为现在世界确实需要更多的播客。
有趣的是,Microsoft 选择在其成立周年之际宣布这些类似于竞争对手平台已有功能的 AI 特性。在上周接受 CNBC 采访时,Suleyman 据报道表示,公司的策略是"紧随其后",在其他公司率先推进 AI 前沿的同时,享受较低的成本并瞄准特定的使用场景。
无论 Microsoft 报道的策略如何,这些公告表明公司仍然完全致力于 Copilot,其客户必须为即将到来的变化做好准备。
好文章,需要你的鼓励
谷歌Agent Development Kit(ADK)革新了AI应用开发模式,采用事件驱动的运行时架构,将代理、工具和持久化状态整合为统一应用。ADK以Runner为核心,通过事件循环处理用户请求、模型调用和外部工具执行。执行逻辑层管理LLM调用和工具回调,服务层提供会话、文件存储等持久化能力。这种架构支持多步推理、实时反馈和状态管理,为构建超越简单聊天界面的生产级AI应用提供了完整框架。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
苹果在iOS 26中推出全新游戏应用,为iPhone、iPad和Mac用户提供个性化的游戏中心。该应用包含五个主要版块:主页展示最近游戏和推荐内容,Arcade专区提供超过200款无广告游戏,好友功能显示Game Center动态并支持游戏挑战,资料库可浏览已安装游戏并提供筛选选项,搜索功能支持按类别浏览。iOS 26.2版本还增加了游戏手柄导航支持,为游戏玩家提供更便捷的操作体验。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。