微软再次将AI技术引入Windows 11,推出了包括其争议性Recall功能的继任者在内的多项新功能,这个名为Copilot Vision的屏幕流传输远程处理后台驱动程序更加令人担忧。
"AI正在改变我们使用PC的方式,"微软声称,虽然有些人可能同意这一观点,但并非所有人都认为这是一个积极的改变。
微软补充道:"Windows 11是AI的家园,为消费者在Copilot+ PC上提供当今最广泛、最强大的AI体验——具有独特的AI超能力,如Recall(预览版)、Click to Do(预览版)和改进的Windows搜索,以及与PC交互的突破性新方式,如Windows上的Copilot Vision。"
Copilot Vision是微软争议性Recall功能的扩展,Recall功能最初只在具有足够计算能力的神经协处理器的Copilot+系统上提供。与因严重安全缺陷而被撤回并经历长时间延迟才重新推出的Recall一样,Copilot Vision旨在分析用户在计算机上的所有操作。
启用后,该功能通过持续截屏并将其提供给光学字符识别系统和大语言模型进行分析——但与本地运行的Recall不同,Copilot Vision会将数据发送到微软服务器。
根据微软发言人在4月份的说法,用户数据不会长期存储,除了与Copilot助手本身的对话记录,并且"不会用于模型训练或广告个性化"。
微软对Vision的愿景是,用Copilot团队的话说,最终成为"真正的伴侣",提供"对您目标的更深入理解以及帮助您实现目标的清晰、逐步指导能力"。
虽然屏幕监控只在用户明确激活它作为Copilot会话的一部分时才会发生,不像始终在后台运行的Recall,但它也被设计得比以前的版本更加主动——这对许多读者来说,会让人想起Clippy及其从Microsoft Office 97开始的动画助手队伍。
在撰写本文时,微软仅在美国提供Copilot Vision,并承诺(或威胁)很快将在非常具体的"非欧洲国家"推出——这似乎是对欧盟AI法案的致敬。然而,这并不意味着那些边界之外的人完全逃脱。该公司对Windows 11的最新更新(其官方支持生命周期内唯一的主流操作系统版本)带来了一系列其他AI功能,包括操作系统的第一个"智能体"AI,现在可以代表用户调整系统设置。
基于名为Mu的本地语言模型,仅适用于运行Qualcomm Snapdragon硬件的Copilot+系统,Intel和AMD支持将随后推出,该智能体承诺代表用户采取行动。与以前版本中简单搜索如何更改屏幕分辨率或连接蓝牙设备不同,该智能体接受自然语言指令——如"连接到我的蓝牙设备"或"将我的屏幕分辨率更改为1920 x 1080"——并提供自己执行任务的功能,前提是它知道如何操作。
微软Windows应用科学副总裁兼工程师Vivek Pradeep在Mu的测试版发布时解释道:"我们的目标是在设置中创建一个由AI驱动的智能体,它能理解自然语言并无缝更改相关的可撤销设置。我们的目标是将这个智能体集成到现有的搜索框中,以获得流畅的用户体验,为众多可能的设置要求超低延迟。"
Pradeep承认:"管理大量的Windows设置本身就带来了挑战,特别是功能重叠的问题。例如,即使是'增加亮度'这样的简单查询也可能涉及多个设置更改——如果用户有双显示器,这是指增加主显示器还是副显示器的亮度?为了解决这个问题,我们改进了训练数据,优先考虑最常用的设置,同时继续为更复杂的任务改进体验。"
微软没有说明的是,对于一个专门定制为足够小以便在设备上运行的模型,它如何解决语言模型固有的未解决的"幻觉"问题——即在将用户提示转换为Token流并返回最具统计可能性的Token作为延续的过程中,模型输出的Token变成一个答案形状的对象,但不幸的是,完全脱离现实。对于聊天机器人式的大语言模型实现,这意味着错误答案;对于采取行动的智能体AI,这可能意味着灾难,正如Replit平台的一位用户最近沮丧地发现的那样。
微软还为其"Click to Do"发布了新的操作,在欧洲经济区以外的国家作为预览版提供,该功能可以听用户大声朗读段落以提高阅读技能,在Microsoft Word中使用Copilot的生成式AI功能,将任何选定的文本作为提示,激活具有可调视觉效果、文本转语音、音节分解功能和图片词典的"沉浸式阅读器"模式,以及在Microsoft Teams中触发消息和安排请求。
该公司的AI推进并不止于此。它还在照片应用中添加了AI驱动的"重新打光"功能,旨在模拟在现有照片中添加最多三个虚拟光源的效果。曾经简单的鼠标教学工具画图也获得了自己的AI更新,具有"贴纸生成器"功能,可将文本提示转换为卡通图像,以及"对象选择"功能,旨在使在繁忙图像中选择单个元素变得更容易。甚至取代简单截图的截图工具也未能幸免,获得了Copilot+独有的"完美截图"功能,该功能可根据屏幕内容自动调整捕获区域大小——还有一个颜色选择器工具,这可以说根本不需要任何机器学习。
最新的Windows 11更新并不全是关于AI的,尽管考虑到微软日益绝望的关注点,你会被原谅如此认为。它还带来了经典蓝屏死机(BSoD)的终结,这个熟悉的景象一直追溯到最初的Windows 1.0——在Windows 3.0中曾短暂改为黑色,Windows NT 3.1是第一个拥有在蓝色背景上显示关键系统错误的"真正"BSoD的版本。现在BSoD变成了黑屏死机,至少保留了经典的缩写。
新的BSoD不仅仅代表数字涂装的新外衣。微软表示,新的错误界面将不那么冗长且更易读,同时该公司还添加了一个名为"快速机器恢复"的系统,取代了早期的"启动修复"。
当该功能在今年早些时候作为测试版发布时,微软的Riddhi Ameser写道:"通过快速机器恢复,当广泛的中断影响设备正常启动时,微软可以通过Windows RE恢复环境向受影响的设备广泛部署有针对性的修复——自动化修复并快速让用户进入生产状态,无需复杂的手动干预。"
不过,所有这些功能可能需要一段时间才能普及到您的桌面。微软正在通过其"受控功能推出"系统在接下来的一个月内提供这些功能——该系统旨在通过防止同时向每个用户发送有问题的更新来防止广泛中断。
那些出于某种原因急于尝鲜的人被建议在Windows更新中启用"尽快获取最新更新"复选框;那些不愿在操作系统中添加更多AI臃肿软件的人几乎只能选择寻找微软产品之外的替代方案。
微软推出新款Surface Laptop 5G
在向Windows用户推送更多AI功能的同时,微软还展示了新硬件Surface Laptop 5G——当然,它具有Copilot+支持。
Surface Laptop 5G围绕13.8英寸显示屏构建,比该公司刷新的13英寸Surface Laptop和12英寸Surface Pro更大,配备Intel Core Ultra(第二代)处理器供选择,每个处理器都配有40万亿次运算每秒(TOPS)的神经协处理器用于本地AI模型,以及可选的内置5G蜂窝调制解调器——"将在2025年晚些时候提供"——该公司警告说,这意味着"用户与Microsoft 365 Copilot和其他云工具保持持续连接"。
更多信息可在微软官网获取。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。