微软公司今天宣布对其Windows 11内置的Copilot人工智能助手进行一系列重要升级。
其中部分功能增强已经普遍可用,而其他功能将通过微软的Windows Insider测试程序提供。
在支持Copilot的所有市场中,Windows 11用户现在都可以使用Copilot Vision,这是一个具备计算机视觉功能的助手版本。用户可以请求它提供如何操作新下载应用程序界面的指导。Copilot Vision还可以生成文本、提供图形设计建议并执行其他任务。
此前,用户只能通过语音指令与Copilot Vision互动。微软计划推出聊天机器人界面,增加对文本指令的支持。与此同时,标准版Copilot也将获得新的语音控制功能。用户现在可以通过说"嘿,Copilot"来激活它,并通过说"再见"来结束对话。
第二组AI增强功能将通过微软的Windows Insider功能测试程序提供。这些新增功能的亮点是Copilot Actions的新版本,这是微软在3月份首次预览的AI智能体。该工具可以代表用户自动执行多步骤任务。
3月份首次推出的初始版本只能执行基于浏览器的任务。作为今天宣布的更新的一部分,Copilot Actions将获得与主机计算机上文件交互的能力。这一升级将使用户能够自动执行诸如从本地PDF文档中提取信息等任务。
Copilot还获得了访问存储在OneDrive和Google Drive中文件的能力。微软消费者首席营销官尤素夫·迈赫迪在今天的博客文章中写道:"一旦您选择连接某项服务,Copilot就可以使用您自己的词汇来查找和理解您的个人内容,从而更容易在多个平台上查找和记住您已连接的个人内容中的详细信息。"
另一项通过Windows Insider程序推出的增强功能将使编辑操作系统设置变得更加容易。它将使用户能够用自然语言描述他们希望进行的更改,并让Copilot打开相关的设置页面。
这些新的自动化功能还将伴随其他多项改进。微软计划在Windows 11任务栏中添加一个按钮,使一键启动Copilot成为可能。该公司还将推出Windows 11与Zoom、Manus AI智能体服务以及名为Filmora的视频编辑应用程序的集成。
Q&A
Q1:Copilot Vision是什么?它有哪些新功能?
A:Copilot Vision是具备计算机视觉功能的Copilot助手版本。它可以为用户提供新下载应用程序的界面操作指导,生成文本,提供图形设计建议并执行其他任务。微软还计划为其添加聊天机器人界面,支持文本指令交互。
Q2:Copilot Actions能做什么样的自动化任务?
A:Copilot Actions是微软的AI智能体,可以代表用户自动执行多步骤任务。最新版本不仅能执行基于浏览器的任务,还能与主机计算机上的文件交互,比如从本地PDF文档中提取信息,并且可以访问OneDrive和Google Drive中的文件。
Q3:Windows 11的Copilot还有哪些新的交互方式?
A:Windows 11的Copilot新增了多种交互方式:用户可以通过说"嘿,Copilot"来激活助手,说"再见"来结束对话;用自然语言描述希望进行的系统设置更改;以及通过即将添加到任务栏的按钮实现一键启动。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。