我们都熟悉Microsoft Windows作为操作系统的基本概念。您安装应用程序,用鼠标点击,也许在旁边编写一些脚本。这种模式仍然存在,但现在它与一些根本性的新事物并存:代表用户行动而非等待指令的软件。AI智能体可以解释任务、做出决策并执行操作,其表现更像是数字同事而非工具。
这种转变迫使我们重新思考操作系统必须做什么。如果智能体要执行模仿人类行为的任务——检索文件、更改设置、操作应用程序——Windows必须识别、管理和约束它们。在Ignite 2025大会上,微软预览了Windows的多项更新,展示了这一转型的早期轮廓。
我与微软产品管理合作伙伴总监Jatinder Mann和Windows开发者平台产品营销管理总监Divya Venkataramu进行了交流,讨论了这些更新及其对企业和用户的意义。
智能体交互的新基础架构
这一转变中最重要的部分之一是对模型上下文协议(MCP)的原生支持。MCP为智能体提供了与工具和数据源交互的标准化方式——这在AI能力出现在意想不到的地方时至关重要,包括新一波具有AI功能的浏览器竞争成为数字工作的中心界面。当这些浏览器引入自己的智能体功能时,显然仅仅浏览是不够的。操作系统必须为任何接入系统资源的东西提供稳定、安全的访问点。
Windows通过引入"智能体连接器"的设备端注册表将MCP进一步推进——这些MCP服务器代表特定功能,如文件访问或系统配置。对这些连接器的所有调用都通过操作系统级代理进行,该代理处理身份、权限、同意和审计日志。
正如Jatinder在我们的讨论中解释的:"这种基础架构不能仅通过中间件或应用程序轻松交付,因为它需要操作系统级集成以确保安全性、同意和控制。"这一评论阐释了为什么微软将这些控制嵌入平台层而不是留给个别开发者。
明确的功能,明确的护栏
预览中提供的首批连接器专注于两个核心领域:文件资源管理器和系统设置。它们让智能体检索和组织文件,或修改显示模式或辅助功能等设置。这些是小而熟悉的任务——但它们展示了为什么结构很重要。连接器会宣告它能做什么、在什么条件下、有什么限制。没有歧义,没有界面抓取,也没有对行为的猜测。
Windows通过明确的同意模型支持这些功能。每当智能体想要访问连接器时,系统都会向用户提示清晰的解释和选项:允许一次、始终允许或永不允许。这是一个熟悉的模式,但它需要避免变成无形的噪音,就像cookie横幅和UAC提示那样。
透明度在这里至关重要。一个系统提示准确告诉您智能体想要什么以及为什么想要,比通用权限请求有用得多。而且因为每个选择都可以从中央化设置页面撤销,该模型鼓励谨慎实验而非无法撤销的一揽子批准。
给智能体自己的空间
最有趣的变化之一是智能体工作区——一个独立的、隔离的桌面环境,智能体在其中以自己的身份运行。智能体不是将其操作与您的混合,而是在包含的会话中与您并行运行。操作系统可以归属操作、监控访问并限制智能体能够触及的内容。
这一设计认识到了一个新兴现实:智能体的行为更像自主行动者而非传统软件。它们可以比人类更快地执行任务,有时比预期更积极。误解指令可能导致意想不到的后果。精灵问题——智能体实现提示的字面意思而非预期意思——并非假设。约束很重要。
正如Divya所说:"在Windows上的任何时候,智能体都将以最低权限访问运行。它们只能访问您定义的内容。"
最小权限自网络安全诞生以来一直是驱动原则。将其应用于智能体AI也至关重要,并在自主软件深度嵌入日常工作流程之前围绕它构建受控边界。
安全期望随自主性提高
一旦系统允许自主软件代表用户行动,安全标准就会大幅提高。连接器现在必须被签名、打包并与明确的功能声明关联。操作系统知道谁创建了它们、它们能做什么以及它们是否被篡改。智能体也通过标准化代理运行,该代理执行身份验证、授权和审计。
可见性的需求是显而易见的。如果智能体删除了错误的日历条目、错误地修改了配置,或以意外方式升级权限,系统必须能够准确确定是哪个智能体做的以及为什么。当应用程序只是按用户指示运行时,这种可观察性水平并非必需。当软件可以独立行动时,它变得不可妥协。
组织已经开始将智能体更多地视为新类别的数字工作者——能力强、快速且可能出错——而非工具。没有操作系统级控制,就没有可靠的方式来监控或管理这种行为。
本地AI作为原生功能
另一个关键组件是设备端AI处理的扩展。Windows正在引入图像生成、视频增强、内容搜索和其他模型驱动功能的API——包括对直接在设备上运行更高级模型的支持。本地推理减少延迟,保持敏感数据离线,并为智能体提供对其依赖功能的更快访问。
这部分对Windows来说并非独有,但与操作系统级连接器和权限的集成赋予了它不同的特色。智能体可以使用与系统资源相同的治理路径调用本地模型,这保持了行为的可预测性和可审计性。
开始转变的平台
这一切都不意味着Windows突然成为了以智能体为首的操作系统。人类用户仍然处于体验的中心。但双重模式的基础——人类在一个空间操作,智能体在另一个空间操作——已经开始。
操作系统正在成为身份、权限、约束和日志记录汇聚的地方。随着更多应用程序、浏览器和服务推出自己的AI助手或嵌入式智能体,Windows正在将自己定位为这些智能体可以安全执行操作的仲裁者。
这是长期过渡的早期阶段。AI智能体的价值需要时间才能在企业和消费者层面显现。但架构组件——标准接口、明确权限、隔离执行环境和系统级可观察性——正在开始出现。
Q&A
Q1:MCP协议是什么?它在Windows中有什么作用?
A:MCP是模型上下文协议,为AI智能体提供了与工具和数据源交互的标准化方式。Windows对MCP的原生支持让智能体能够通过操作系统级代理安全地访问文件、系统设置等功能,同时处理身份验证、权限控制和审计日志。
Q2:智能体工作区是如何保护用户的?
A:智能体工作区是一个独立的、隔离的桌面环境,让智能体以自己的身份运行,而不与用户操作混合。这样操作系统可以归属每个操作、监控访问范围并限制智能体能够触及的内容,确保智能体只能以最低权限访问用户定义的内容。
Q3:为什么Windows要在操作系统层面管理AI智能体?
A:因为智能体可以独立行动并执行复杂任务,需要比传统软件更高的安全标准。操作系统层面的管理能够提供统一的身份验证、权限控制、行为监控和审计能力,确保智能体的操作可预测、可追踪且安全可控。
好文章,需要你的鼓励
微软在Ignite 2025大会上预览了Windows的重要更新,显示出操作系统向支持AI智能体的根本性转变。新增功能包括原生支持模型上下文协议(MCP)、智能体连接器注册表、明确的权限管控模型,以及独立的智能体工作空间。这些更新建立了OS级别的身份验证、授权和审计机制,让智能体能够安全地执行文件操作和系统设置等任务,同时保持可控性和可追溯性。
瑞士洛桑联邦理工学院研究团队开发出"稳定视频无限"技术,通过创新的"错误循环利用"方法解决了AI视频生成长度限制问题。该技术让AI在训练时主动学习处理各种错误,从而能够生成任意长度的高质量视频内容,支持复杂场景转换和多模态控制,为内容创作、教育和娱乐行业带来revolutionary变革。
苹果即将发布的macOS Tahoe 26.2系统将支持通过雷雳5连接多台Mac设备,构建低延迟AI超算集群。该功能支持Mac Studio、M4 Pro Mac mini和MacBook Pro等设备。四台Mac Studio可高效运行万亿参数的Kimi-K2-Thinking模型,功耗不到500瓦,比传统GPU集群低10倍。此外,MLX项目将获得M5芯片神经加速器的完整访问权限。
华为诺亚实验室等机构联合提出了一种创新的AI训练方法,通过双层优化框架让AI从数据中自动学习评价标准。该方法结合了传统最大似然估计和强化学习的优势,在表格分类和模型驱动强化学习任务中展现出更好的收敛性和泛化能力,为解决强化学习中缺乏明确奖励信号的问题提供了新思路。