谷歌与代码编辑器公司Zed Industries联合推出了智能体客户端协议(ACP),旨在为AI智能体与集成开发环境(IDE)的整合提供标准化方案,防止开发者被锁定在VS Code中。
该协议的概述指出:"AI编码智能体与编辑器紧密耦合,但互操作性并非默认选项。"目前每个新的智能体-编辑器组合都需要定制开发工作。
微软的VS Code是最受欢迎的程序员编辑器和IDE,微软为其加载了大量AI功能,其中许多专门针对GitHub Copilot。一些AI竞争对手已经分叉VS Code以便与自己的产品顺畅集成,但这并非理想解决方案,特别是考虑到微软控制着VS Code的扩展市场。
仍在开发中的ACP是智能体-编辑器通信的标准化协议。智能体进程由代码编辑器启动,通过标准输入/输出使用JSON-RPC进行通信。ACP尽可能重用模型上下文协议(MCP)规范,同时添加自定义类型。格式化文本基于Markdown。
该协议提供了TypeScript和Rust的实现库。
据Zed首席执行官兼联合创始人Nathan Sobo透露,ACP项目由谷歌发起,其Gemini命令行界面(CLI)团队正在使用Zed并希望实现更深度的集成。因此,Zed目前是唯一直接支持该协议的编辑器,尽管Neovim也有相应扩展。目前唯一的ACP智能体是Gemini CLI,这是当前的参考实现。
Sobo表示,ACP可能产生类似语言服务器协议的影响——后者是微软为编程语言智能编辑器功能开发的标准,但ACP针对的是AI智能体。"ACP为智能体生态系统创造了空间,"他说。
谷歌在声明中表示:"我们的'自带IDE'理念是提供选择,而不是将用户锁定在单一环境中。"该公司表示,与Zed的集成有助于将Gemini CLI转变为视觉智能体。
包括Anthropic热门产品Claude Code在内的CLI智能体的部分吸引力在于,开发者可以在任何IDE中使用它们。如果ACP被广泛采用,可以同时提供基于CLI和集成IDE的功能,而不将开发者绑定到任何特定IDE。
VS Code已经是每个智能体都必须支持的编辑器。谷歌为VS Code提供了Gemini CLI伴侣,Anthropic也有Claude Code扩展。因此,微软支持ACP的动机最小,不过这或许可以测试该公司的开源承诺。
Q&A
Q1:什么是智能体客户端协议ACP?
A:ACP是谷歌与Zed Industries联合推出的标准化协议,用于AI智能体与集成开发环境的整合。它通过JSON-RPC over stdio进行通信,重用模型上下文协议规范,并提供TypeScript和Rust实现库。
Q2:ACP协议能解决什么问题?
A:ACP主要解决AI智能体与编辑器紧密耦合但缺乏互操作性的问题。目前每个新的智能体-编辑器组合都需要定制开发,ACP提供标准化方案,防止开发者被锁定在特定IDE中。
Q3:目前哪些产品支持ACP协议?
A:目前Zed是唯一直接支持ACP的编辑器,Neovim有相应扩展。唯一的ACP智能体是谷歌的Gemini CLI,作为当前的参考实现。该协议仍在开发中,未来可能有更多产品支持。
好文章,需要你的鼓励
Anthropic对用户数据处理政策进行重大调整,要求所有Claude用户在9月28日前决定是否允许其对话数据用于AI模型训练。此前该公司不使用消费者聊天数据进行模型训练,现在希望利用用户对话和编程会话来训练AI系统,未选择退出的用户数据保留期将延长至五年。新政策适用于Claude免费版、专业版和最高版用户,但不影响企业客户。
谷歌DeepMind团队开发了过程监督强化学习技术,让AI学会像人类一样进行复杂推理。该方法不仅关注最终答案,更重视推理过程中每一步的合理性。在数学推理测试中,AI准确率从41%提升至73%。这项技术为AI在教育、科研、医疗等领域的应用开辟了新可能,让AI决策过程更加透明可信。
OpenAI和微软发布了两款新的语音人工智能模型。OpenAI的gpt-realtime被称为其最强语音模型,可生成更自然的语音并能在句中改变语调和语言。微软推出的MAI-Voice-1模型已集成到Copilot助手中,具有高硬件效率,单个GPU即可在一秒内生成一分钟音频。两家公司还发布了MAI-1-preview模型,采用专家混合架构提高效率。
上海AI实验室等机构联合研究开发的InMind框架,通过阿瓦隆社交推理游戏测试AI是否能理解和模仿人类个性化推理风格。研究发现,尽管GPT-4o等先进模型在基础任务表现良好,但在理解个性化推理方面仍有明显不足,大多依赖词汇相似性而非深层推理模式。DeepSeek-R1等推理优化模型展现出更好潜力,为开发更懂人心的AI系统指明了方向。