微软Windows负责人帕万·达武鲁里最近在网上发表了关于Windows成为"智能体操作系统"的赞美言论,却遭到了评论区的大规模反对。用户们的核心观点是:"智能体什么的都是虚的,我们要的是可靠性、易用性和稳定性。"
达武鲁里回应时使用了经典的"我们听到了你们的声音",承认在这些方面还有工作要做,但奇怪的是,他声称必须在用户反馈和团队通过"其他渠道"听到的声音之间取得平衡。这个表述很模糊,但至少在一个方面可以明确解读:可靠性、易用性和稳定性并不是优先考虑的。如果是的话,他会明确说出来,但他没有。
微软从事的是工程业务,工程有其规则。所有设计都是妥协,创新意味着做意想不到的事情。优先考虑基础功能与这两者并不冲突,相反,它是两者的基础。没有这个基础,就会出现其他问题。这个问题可以用两个词来概括——智能体操作系统。因为无论智能体操作系统是什么,它都不是好的工程实践。
操作系统有一个非常明确的工作职责,这个职责随着时间的推移而演变,并将继续演变到未来,但始终保持绝对清晰。它控制计算机的资源,无论是虚拟的还是物理的,将它们作为一组标准抽象服务呈现给用户交互的应用程序和环境。除此之外,它应该让开道路。这对MS-DOS 1.0是正确的,对Windows 11也是正确的。在这个过程中,原本是8位操作系统的快速粗糙克隆版本已经吸收了多种CPU架构、多任务处理、安全性,以及相当于从单细胞藻类到80亿智能猿类行星生态系统的硅演化。然而,它仍在做同样的工作,尽管规模令人叹为观止地不同。
智能体计算不适合这里。它不是操作系统服务。可以说,它与核心操作系统原则背道而驰。智能体计算是关于智能体的,即在现代多样化的本地和远程服务及应用程序混合环境中代表用户执行任务的东西。智能体平台是有意义的,就像SaaS平台有意义一样。"SaaS操作系统"是一个无意义的概念,至少在桌面计算方面是这样。
智能体组件应该存在于应用层之上,即用户所在的地方。它们必须获取数据、运行服务和启动操作,但要以尊重用户的方式进行。
将智能体功能放在操作系统本体内的唯一原因是为了特权访问超出用户和用户级应用程序需要的数据和服务。现代操作系统花费大量时间来保持事物的分区化和安全性。这里没有任何东西需要为承担用户任务的智能体进程提供特殊豁免或权力。
将Windows称为智能体操作系统而不是平台可能看起来像语义问题,但在工程中,说出你的意思很重要。微软一直喜欢将Windows操作系统与它附带的完整应用程序和非操作系统服务包混为一谈。Windows桌面环境是核心操作系统的一部分吗?实际上是的;架构上不是。Linux及其多种桌面环境选择在这里要明确得多,但这种广泛采用并没有带来好处。
更糟糕的是坚持认为用户级应用程序或功能对操作系统如此重要,以至于无法删除。臭名昭著的是,比尔·盖茨在1990年代美国反垄断法庭案件中辩称,Internet Explorer与Windows如此不可分割,以至于在技术上不可能将其删除。正如当时法庭文件所揭示的,IE实际上对微软决心使公司成为网络不可移除的组成部分至关重要。对于当时任何具有操作系统架构工作知识的人来说,这些声明是多么站不住脚是显而易见的。由于现在对AI主导地位的争夺与当时控制网络的争夺一样强烈,应用同样的批判性思维是合适的。
回到1990年代,人们迫切想要上网。智能体AI背后的迫切性来自其他地方,大概是未定义的"其他渠道"而不是用户反馈。
你必须使用操作系统,但你可以选择采用平台,而智能体平台的采用程度会低到可以液化氦气。这是市场工程——至少,让我们希望如此。
无论AI有什么合法的地位,在操作系统内部都不是其中之一。不过,我们会接受你们所有的可靠性、易用性和稳定性。
Q&A
Q1:什么是智能体操作系统?为什么引起争议?
A:智能体操作系统是微软提出的概念,指将AI智能体功能深度集成到Windows操作系统中。这引起争议是因为用户更关心系统的可靠性、易用性和稳定性,而不是AI功能,认为微软没有优先解决基础问题。
Q2:为什么说AI不应该放在操作系统核心?
A:操作系统的核心职责是控制计算机资源并提供标准抽象服务,然后让开道路。智能体功能应该存在于应用层之上,在用户所在的地方。将AI功能放入OS核心违背了操作系统的基本原则,也不符合良好的工程实践。
Q3:微软这样做的真实目的是什么?
A:文章认为这类似于1990年代微软将Internet Explorer深度集成到Windows中的做法,目的是获得对数据和服务的特权访问,确保在AI竞争中的主导地位,而不是真正为了用户需求。
好文章,需要你的鼓励
微软于12月1日正式关闭混合现实协作平台Mesh,将用户引导至Teams的沉浸式活动功能。Mesh作为独立服务在2024年正式发布,提供3D虚拟会议环境,但与Teams功能重叠明显。微软已将相关功能直接整合到Teams中,需要商业Teams许可证和Premium许可证才能主持沉浸式活动。这标志着微软元宇宙雄心的终结,公司已放弃HoloLens项目和美军合同,转向AI发展战略。
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
亚马逊云服务发布AI工厂解决方案,支持政府和监管行业在本地数据中心部署完整AWS AI基础设施。同时推出搭载三纳米Trainium3芯片的EC2 Trn3超级服务器,性能较前代提升4.4倍,能效提升4倍。此外还引入配备英伟达GB300 NVL72平台的P6e-GB300超级服务器,为万亿参数AI推理提供最高GPU密度支持。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。