随着AI智能体的能力日益增强,企业在将其部署于应用、工作流与产品中的过程中面临新的挑战:如何确保智能体在不同环境下都能按预期运行。
微软正试图通过一项名为"智能体控制规范"(Agent Control Specification,ACS)的新开源标准来解决这一问题。该标准旨在为开发者提供一种更一致、更精细的方式,以控制AI智能体的行为边界。
该规范允许开发、合规与安全团队为智能体自定义策略规则,明确规定智能体可以执行哪些操作、禁止执行哪些操作、哪些操作需要人工审批,以及哪些行为需要记录日志以备后续审查。这些策略文件会在智能体执行任务的多个"拦截节点"被检查,以确保其始终在规定范围内运行。
ACS的推出有其现实背景。当前,开发者普遍采用临时性手段来管控AI智能体的行为,尤其是在业界日益关注AI工作流因工具误用或意外操作引发连锁故障的背景下。现有的常见做法包括:在系统提示词中嵌入指令、在应用代码中添加自定义检查,或使用分类器过滤问题输入与输出。这些方法虽有一定效果,但往往导致控制手段分散、难以审计,且难以在不同框架、界面和系统之间复用。
ACS的目标是将这些分散的控制机制整合为一个统一的治理层。微软表示,该规范可在智能体工作流的多个环节进行合规检查,包括:接收输入前、调用工具前、工具返回结果后,以及向用户发送最终响应前。策略可配置为允许某项操作、阻止该操作、对敏感信息进行脱敏处理,或将其上报给人工进行审批。
此外,开发者还可以为输入与输出插入分类器,用于信息分类、结果预测或确定智能体的响应方式;引入大语言模型并配置提示词,使其充当策略的"裁判员";以及添加逻辑规则,用于检查工具调用、工具选择、输入准确性、输出使用情况与响应内容。
由于这些策略可以打包为单一文件并随智能体一同分发,安全策略得以在不同框架和环境中跟随智能体持续生效。
ACS目前以SDK形式发布,并提供适用于LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI、MCP工具等主流框架的插件支持。
Q&A
Q1:微软ACS(智能体控制规范)是什么?它能解决哪些问题?
A:ACS是微软推出的一项开源标准,全称为Agent Control Specification(智能体控制规范)。它为开发者提供了一种统一、精细的方式来管控AI智能体的行为。通过定义策略文件,团队可以规定智能体可以做什么、不能做什么、哪些操作需要人工审批,以及哪些行为需要留存日志。这些策略会在智能体执行任务的多个关键节点进行检查,有效防止工具误用或意外操作引发的连锁问题。
Q2:ACS和现有的AI智能体控制方式有什么区别?
A:目前开发者通常通过系统提示词、自定义代码检查或分类器等方式来控制AI智能体,这些方法较为分散,难以统一审计,也难以在不同框架之间复用。ACS将这些控制机制整合为一个统一的治理层,策略以文件形式存在,可随智能体跨框架、跨环境部署,显著提升了可管理性和可复用性。
Q3:ACS目前支持哪些开发框架?
A:ACS以SDK形式发布,目前已支持多个主流AI开发框架,包括LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI以及MCP工具等,覆盖了当前主要的AI智能体开发生态。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。