微软Windows负责人帕万·达武鲁里最近在网上发表了关于Windows成为"智能体操作系统"的赞美言论,却遭到了评论区的大规模反对。用户们的核心观点是:"智能体什么的都是虚的,我们要的是可靠性、易用性和稳定性。"
达武鲁里回应时使用了经典的"我们听到了你们的声音",承认在这些方面还有工作要做,但奇怪的是,他声称必须在用户反馈和团队通过"其他渠道"听到的声音之间取得平衡。这个表述很模糊,但至少在一个方面可以明确解读:可靠性、易用性和稳定性并不是优先考虑的。如果是的话,他会明确说出来,但他没有。
微软从事的是工程业务,工程有其规则。所有设计都是妥协,创新意味着做意想不到的事情。优先考虑基础功能与这两者并不冲突,相反,它是两者的基础。没有这个基础,就会出现其他问题。这个问题可以用两个词来概括——智能体操作系统。因为无论智能体操作系统是什么,它都不是好的工程实践。
操作系统有一个非常明确的工作职责,这个职责随着时间的推移而演变,并将继续演变到未来,但始终保持绝对清晰。它控制计算机的资源,无论是虚拟的还是物理的,将它们作为一组标准抽象服务呈现给用户交互的应用程序和环境。除此之外,它应该让开道路。这对MS-DOS 1.0是正确的,对Windows 11也是正确的。在这个过程中,原本是8位操作系统的快速粗糙克隆版本已经吸收了多种CPU架构、多任务处理、安全性,以及相当于从单细胞藻类到80亿智能猿类行星生态系统的硅演化。然而,它仍在做同样的工作,尽管规模令人叹为观止地不同。
智能体计算不适合这里。它不是操作系统服务。可以说,它与核心操作系统原则背道而驰。智能体计算是关于智能体的,即在现代多样化的本地和远程服务及应用程序混合环境中代表用户执行任务的东西。智能体平台是有意义的,就像SaaS平台有意义一样。"SaaS操作系统"是一个无意义的概念,至少在桌面计算方面是这样。
智能体组件应该存在于应用层之上,即用户所在的地方。它们必须获取数据、运行服务和启动操作,但要以尊重用户的方式进行。
将智能体功能放在操作系统本体内的唯一原因是为了特权访问超出用户和用户级应用程序需要的数据和服务。现代操作系统花费大量时间来保持事物的分区化和安全性。这里没有任何东西需要为承担用户任务的智能体进程提供特殊豁免或权力。
将Windows称为智能体操作系统而不是平台可能看起来像语义问题,但在工程中,说出你的意思很重要。微软一直喜欢将Windows操作系统与它附带的完整应用程序和非操作系统服务包混为一谈。Windows桌面环境是核心操作系统的一部分吗?实际上是的;架构上不是。Linux及其多种桌面环境选择在这里要明确得多,但这种广泛采用并没有带来好处。
更糟糕的是坚持认为用户级应用程序或功能对操作系统如此重要,以至于无法删除。臭名昭著的是,比尔·盖茨在1990年代美国反垄断法庭案件中辩称,Internet Explorer与Windows如此不可分割,以至于在技术上不可能将其删除。正如当时法庭文件所揭示的,IE实际上对微软决心使公司成为网络不可移除的组成部分至关重要。对于当时任何具有操作系统架构工作知识的人来说,这些声明是多么站不住脚是显而易见的。由于现在对AI主导地位的争夺与当时控制网络的争夺一样强烈,应用同样的批判性思维是合适的。
回到1990年代,人们迫切想要上网。智能体AI背后的迫切性来自其他地方,大概是未定义的"其他渠道"而不是用户反馈。
你必须使用操作系统,但你可以选择采用平台,而智能体平台的采用程度会低到可以液化氦气。这是市场工程——至少,让我们希望如此。
无论AI有什么合法的地位,在操作系统内部都不是其中之一。不过,我们会接受你们所有的可靠性、易用性和稳定性。
Q&A
Q1:什么是智能体操作系统?为什么引起争议?
A:智能体操作系统是微软提出的概念,指将AI智能体功能深度集成到Windows操作系统中。这引起争议是因为用户更关心系统的可靠性、易用性和稳定性,而不是AI功能,认为微软没有优先解决基础问题。
Q2:为什么说AI不应该放在操作系统核心?
A:操作系统的核心职责是控制计算机资源并提供标准抽象服务,然后让开道路。智能体功能应该存在于应用层之上,在用户所在的地方。将AI功能放入OS核心违背了操作系统的基本原则,也不符合良好的工程实践。
Q3:微软这样做的真实目的是什么?
A:文章认为这类似于1990年代微软将Internet Explorer深度集成到Windows中的做法,目的是获得对数据和服务的特权访问,确保在AI竞争中的主导地位,而不是真正为了用户需求。
好文章,需要你的鼓励
Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。
香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。
在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?
华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。