微软公司今天宣布对其Windows 11内置的Copilot人工智能助手进行一系列重要升级。
其中部分功能增强已经普遍可用,而其他功能将通过微软的Windows Insider测试程序提供。
在支持Copilot的所有市场中,Windows 11用户现在都可以使用Copilot Vision,这是一个具备计算机视觉功能的助手版本。用户可以请求它提供如何操作新下载应用程序界面的指导。Copilot Vision还可以生成文本、提供图形设计建议并执行其他任务。
此前,用户只能通过语音指令与Copilot Vision互动。微软计划推出聊天机器人界面,增加对文本指令的支持。与此同时,标准版Copilot也将获得新的语音控制功能。用户现在可以通过说"嘿,Copilot"来激活它,并通过说"再见"来结束对话。
第二组AI增强功能将通过微软的Windows Insider功能测试程序提供。这些新增功能的亮点是Copilot Actions的新版本,这是微软在3月份首次预览的AI智能体。该工具可以代表用户自动执行多步骤任务。
3月份首次推出的初始版本只能执行基于浏览器的任务。作为今天宣布的更新的一部分,Copilot Actions将获得与主机计算机上文件交互的能力。这一升级将使用户能够自动执行诸如从本地PDF文档中提取信息等任务。
Copilot还获得了访问存储在OneDrive和Google Drive中文件的能力。微软消费者首席营销官尤素夫·迈赫迪在今天的博客文章中写道:"一旦您选择连接某项服务,Copilot就可以使用您自己的词汇来查找和理解您的个人内容,从而更容易在多个平台上查找和记住您已连接的个人内容中的详细信息。"
另一项通过Windows Insider程序推出的增强功能将使编辑操作系统设置变得更加容易。它将使用户能够用自然语言描述他们希望进行的更改,并让Copilot打开相关的设置页面。
这些新的自动化功能还将伴随其他多项改进。微软计划在Windows 11任务栏中添加一个按钮,使一键启动Copilot成为可能。该公司还将推出Windows 11与Zoom、Manus AI智能体服务以及名为Filmora的视频编辑应用程序的集成。
Q&A
Q1:Copilot Vision是什么?它有哪些新功能?
A:Copilot Vision是具备计算机视觉功能的Copilot助手版本。它可以为用户提供新下载应用程序的界面操作指导,生成文本,提供图形设计建议并执行其他任务。微软还计划为其添加聊天机器人界面,支持文本指令交互。
Q2:Copilot Actions能做什么样的自动化任务?
A:Copilot Actions是微软的AI智能体,可以代表用户自动执行多步骤任务。最新版本不仅能执行基于浏览器的任务,还能与主机计算机上的文件交互,比如从本地PDF文档中提取信息,并且可以访问OneDrive和Google Drive中的文件。
Q3:Windows 11的Copilot还有哪些新的交互方式?
A:Windows 11的Copilot新增了多种交互方式:用户可以通过说"嘿,Copilot"来激活助手,说"再见"来结束对话;用自然语言描述希望进行的系统设置更改;以及通过即将添加到任务栏的按钮实现一键启动。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。