谷歌与代码编辑器公司Zed Industries联合推出了智能体客户端协议(ACP),旨在为AI智能体与集成开发环境(IDE)的整合提供标准化方案,防止开发者被锁定在VS Code中。
该协议的概述指出:"AI编码智能体与编辑器紧密耦合,但互操作性并非默认选项。"目前每个新的智能体-编辑器组合都需要定制开发工作。
微软的VS Code是最受欢迎的程序员编辑器和IDE,微软为其加载了大量AI功能,其中许多专门针对GitHub Copilot。一些AI竞争对手已经分叉VS Code以便与自己的产品顺畅集成,但这并非理想解决方案,特别是考虑到微软控制着VS Code的扩展市场。
仍在开发中的ACP是智能体-编辑器通信的标准化协议。智能体进程由代码编辑器启动,通过标准输入/输出使用JSON-RPC进行通信。ACP尽可能重用模型上下文协议(MCP)规范,同时添加自定义类型。格式化文本基于Markdown。
该协议提供了TypeScript和Rust的实现库。
据Zed首席执行官兼联合创始人Nathan Sobo透露,ACP项目由谷歌发起,其Gemini命令行界面(CLI)团队正在使用Zed并希望实现更深度的集成。因此,Zed目前是唯一直接支持该协议的编辑器,尽管Neovim也有相应扩展。目前唯一的ACP智能体是Gemini CLI,这是当前的参考实现。
Sobo表示,ACP可能产生类似语言服务器协议的影响——后者是微软为编程语言智能编辑器功能开发的标准,但ACP针对的是AI智能体。"ACP为智能体生态系统创造了空间,"他说。
谷歌在声明中表示:"我们的'自带IDE'理念是提供选择,而不是将用户锁定在单一环境中。"该公司表示,与Zed的集成有助于将Gemini CLI转变为视觉智能体。
包括Anthropic热门产品Claude Code在内的CLI智能体的部分吸引力在于,开发者可以在任何IDE中使用它们。如果ACP被广泛采用,可以同时提供基于CLI和集成IDE的功能,而不将开发者绑定到任何特定IDE。
VS Code已经是每个智能体都必须支持的编辑器。谷歌为VS Code提供了Gemini CLI伴侣,Anthropic也有Claude Code扩展。因此,微软支持ACP的动机最小,不过这或许可以测试该公司的开源承诺。
Q&A
Q1:什么是智能体客户端协议ACP?
A:ACP是谷歌与Zed Industries联合推出的标准化协议,用于AI智能体与集成开发环境的整合。它通过JSON-RPC over stdio进行通信,重用模型上下文协议规范,并提供TypeScript和Rust实现库。
Q2:ACP协议能解决什么问题?
A:ACP主要解决AI智能体与编辑器紧密耦合但缺乏互操作性的问题。目前每个新的智能体-编辑器组合都需要定制开发,ACP提供标准化方案,防止开发者被锁定在特定IDE中。
Q3:目前哪些产品支持ACP协议?
A:目前Zed是唯一直接支持ACP的编辑器,Neovim有相应扩展。唯一的ACP智能体是谷歌的Gemini CLI,作为当前的参考实现。该协议仍在开发中,未来可能有更多产品支持。
好文章,需要你的鼓励
伊朗裔英国导演Ash Koosha耗时两个半月,以不足2000美元的成本,借助AI技术完成了一部关于伊朗反政府抗议镇压事件的75分钟剧情片《紫罗兰之梦》。该片即将在纽约翠贝卡电影节首映,成为首部入围顶级电影节的全AI真人故事片。导演认为,AI技术可大幅降低独立电影制作门槛,有望重塑整个影视行业格局。
耶路撒冷希伯来大学研究团队提出PhyGenHOI框架,将人体运动生成与物理仿真结合,让虚拟人物与三维物体之间的接触互动同时满足视觉自然性和物理真实性。
MIT与MIT-IBM计算研究实验室联合开发了专为图表理解设计的数据集ChartNet,包含逾百万张多样化图表及对应代码、文字描述、数值表格和问答对。研究团队利用两步合成数据生成流程,从单张图表出发可扩展出数百种变体。实验表明,基于ChartNet训练的小型开源视觉语言模型在数据提取、图表摘要等任务上显著超越体量更大的商业模型,有望帮助预算有限的中小企业低成本接入AI图表分析能力。
本文介绍了弗莱堡大学等机构提出的3D-SC框架,通过引入三维基础模型的几何先验,无需人工标注即可解决AI图像匹配中的左右混淆和重复部件分不清的问题。