Microsoft 在其 50 周年之际宣布了一系列新的 Copilot 功能,这些功能对于使用过竞争对手 AI 平台的用户来说可能会感到异常熟悉。
Microsoft AI 负责人 Mustafa Suleyman 写道:"今天,我们正在开启将 Copilot 从一个 AI 助手转变为你的专属 AI 助手的旅程。"
这一转变包括为聊天机器人添加记忆功能 (需要用户许可),使其能够"了解你生活中的细节"。这无疑能提高响应质量,但同时也让人觉得有些不安。
当我们询问 Microsoft 这是否为可选功能时,一位发言人告诉 The Register:"如果个性化功能可用,Copilot 将记住关于你的关键信息,并提供量身定制的 Copilot 体验。如果你不再希望 Copilot 通过记忆功能记住有关你的信息,可以随时选择退出个性化服务。"
OpenAI 在 2024 年为 ChatGPT 添加了记忆功能。
其他更新包括购物功能,可以通过"实时可信商家目录"找到最优惠的交易,以及 Actions 功能,使 Copilot 能够为用户完成任务。Suleyman 举例说明,从"订演唱会门票到安排回家的交通"都可以实现。Actions 功能可以与 OpenAI 的 Operator 功能相媲美。
另一个让人产生似曾相识感的是 Deep Research 功能的推出,它将允许用户"更高效地进行复杂的多步骤研究任务...节省时间并无缝处理复杂任务"。
这听起来很像 OpenAI 的 Deep Research 或 Google Gemini Deep Research。
Copilot Vision 将记忆功能的不安感提升到了新的高度。Android 和 iOS 的移动应用版本将会很有帮助——它们可以识别手机相机视野内的物品并回答相关问题,或使用相册中的照片。
相比之下,同样使用 Copilot Vision 品牌的 Windows 原生桌面版本则显得更令人不安。
据 Microsoft 称,"它将读取屏幕并与内容互动。" Copilot 将能够更改设置、组织文件并协作项目。Windows 预览体验计划的用户将首先体验到这个聊天机器人的功能,而就在上周,这个机器人还认为半个世纪只有 25 年。
Microsoft 发言人告诉 The Register,虽然内容会被传输到公司的云端进行 AI 计算,但"Vision 会话和文件搜索的内容不会用于模型训练或广告个性化。"
此外,"分享给 Copilot Vision 的截图、音频和上下文信息不会被 Copilot 存储。"然而,与 Copilot 的语音对话记录会作为对话历史的一部分被存储,但"可以随时删除"。
接下来是 Pages 功能,它将笔记和研究整合到由 Copilot 组织的"画布"中 (听起来类似于去年的 ChatGPT Canvas),以及 Podcasts 功能,它将生成"根据你的兴趣策划和提供个性化音频内容"的 AI 播客,有点像 Google NotebookLM 的 Audio Overview 功能。
因为现在世界确实需要更多的播客。
有趣的是,Microsoft 选择在其成立周年之际宣布这些类似于竞争对手平台已有功能的 AI 特性。在上周接受 CNBC 采访时,Suleyman 据报道表示,公司的策略是"紧随其后",在其他公司率先推进 AI 前沿的同时,享受较低的成本并瞄准特定的使用场景。
无论 Microsoft 报道的策略如何,这些公告表明公司仍然完全致力于 Copilot,其客户必须为即将到来的变化做好准备。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。