谷歌与代码编辑器公司Zed Industries联合推出了智能体客户端协议(ACP),旨在为AI智能体与集成开发环境(IDE)的整合提供标准化方案,防止开发者被锁定在VS Code中。
该协议的概述指出:"AI编码智能体与编辑器紧密耦合,但互操作性并非默认选项。"目前每个新的智能体-编辑器组合都需要定制开发工作。
微软的VS Code是最受欢迎的程序员编辑器和IDE,微软为其加载了大量AI功能,其中许多专门针对GitHub Copilot。一些AI竞争对手已经分叉VS Code以便与自己的产品顺畅集成,但这并非理想解决方案,特别是考虑到微软控制着VS Code的扩展市场。
仍在开发中的ACP是智能体-编辑器通信的标准化协议。智能体进程由代码编辑器启动,通过标准输入/输出使用JSON-RPC进行通信。ACP尽可能重用模型上下文协议(MCP)规范,同时添加自定义类型。格式化文本基于Markdown。
该协议提供了TypeScript和Rust的实现库。
据Zed首席执行官兼联合创始人Nathan Sobo透露,ACP项目由谷歌发起,其Gemini命令行界面(CLI)团队正在使用Zed并希望实现更深度的集成。因此,Zed目前是唯一直接支持该协议的编辑器,尽管Neovim也有相应扩展。目前唯一的ACP智能体是Gemini CLI,这是当前的参考实现。
Sobo表示,ACP可能产生类似语言服务器协议的影响——后者是微软为编程语言智能编辑器功能开发的标准,但ACP针对的是AI智能体。"ACP为智能体生态系统创造了空间,"他说。
谷歌在声明中表示:"我们的'自带IDE'理念是提供选择,而不是将用户锁定在单一环境中。"该公司表示,与Zed的集成有助于将Gemini CLI转变为视觉智能体。
包括Anthropic热门产品Claude Code在内的CLI智能体的部分吸引力在于,开发者可以在任何IDE中使用它们。如果ACP被广泛采用,可以同时提供基于CLI和集成IDE的功能,而不将开发者绑定到任何特定IDE。
VS Code已经是每个智能体都必须支持的编辑器。谷歌为VS Code提供了Gemini CLI伴侣,Anthropic也有Claude Code扩展。因此,微软支持ACP的动机最小,不过这或许可以测试该公司的开源承诺。
Q&A
Q1:什么是智能体客户端协议ACP?
A:ACP是谷歌与Zed Industries联合推出的标准化协议,用于AI智能体与集成开发环境的整合。它通过JSON-RPC over stdio进行通信,重用模型上下文协议规范,并提供TypeScript和Rust实现库。
Q2:ACP协议能解决什么问题?
A:ACP主要解决AI智能体与编辑器紧密耦合但缺乏互操作性的问题。目前每个新的智能体-编辑器组合都需要定制开发,ACP提供标准化方案,防止开发者被锁定在特定IDE中。
Q3:目前哪些产品支持ACP协议?
A:目前Zed是唯一直接支持ACP的编辑器,Neovim有相应扩展。唯一的ACP智能体是谷歌的Gemini CLI,作为当前的参考实现。该协议仍在开发中,未来可能有更多产品支持。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。