多家科技公司正在联手开发一个标准化的开放框架,目标是让不同组织开发的 AI 代理能够自由、无缝地相互通信。但要实现这一目标,需要解决互操作性问题,因为这些代理可能是基于不同的大语言模型、数据框架和代码构建的。
为实现互操作性,这些代理的开发者们必须就它们之间如何通信达成一致。这是一项具有挑战性的任务。
包括 Cisco、LangChain、LlamaIndex、Galileo 和 Glean 在内的多家公司现已创建了 AGNTCY,这是一个开源集体,旨在创建行业标准的代理互操作语言。AGNTCY 的目标是让任何 AI 代理都能轻松地与其他代理进行通信和数据交换。
统一 AI 代理
Cisco 孵化部门 Outshift 负责人 Vijoy Pandey 在接受 VentureBeat 采访时表示:"就像云计算和互联网的出现加速了全球范围内的应用程序和社交互动一样,我们希望构建 AI 代理互联网,在全球范围内加速所有人类工作。"
Pandey 将 AGNTCY 比作传输控制协议/互联网协议 (TCP/IP) 和域名系统 (DNS) 的出现,这些协议帮助组织了互联网,并实现了不同计算机系统之间的互联。
他说:"我们对这个问题的思考方式是,最初的互联网让人类、服务器和网络农场都能够聚在一起。这是代理互联网,实现这一目标的唯一方法就是使其开放和可互操作。"
Cisco、LangChain 和 Galileo 将作为 AGNTCY 的核心维护者,Glean 和 LlamaIndex 则作为贡献者。随着集体增加更多成员,这种结构可能会发生变化。
快速发展行业的标准化
AI 代理不能成为孤岛。要发挥其全部潜力,它们必须能够与企业网络之外的其他代理进行通信。这就是互操作性发挥作用的地方。
在传统行业制定标准已经够具有挑战性;对于 AI 这样每隔几个月就会进行升级和模型更改的技术来说,这变得更加困难。不过,这并不是第一次有人为生成式 AI 提出标准。
AGNTCY 的核心成员之一 LangChain 已经有了自己的协议,用于与在 LangChain 之外的框架上构建的代理协作。去年 11 月推出的 Agent Protocol 允许 LangChain 代理与使用 AutoGen、CrewAI 或任何其他框架创建的代理进行通信。
同时,Anthropic 也在 11 月宣布了其模型上下文协议 (MCP)。该协议旨在标准化模型和 AI 工具与数据源的连接方式。但虽然许多开发者已经接受了 MCP,但它还不能算是一个真正的标准。
AI 评估平台 Galileo 的联合创始人 Yash Sheth 表示,标准化"至关重要"。
"标准化是必需的,实际上它将推动代理技术的加速采用。如今,团队都在各自为战,不得不从头开始摸索如何开发自己的基础设施组件,"Sheth 在电子邮件中表示。"只有当这些由非确定性模型驱动的代理在衡量和报告其性能、准确性和可靠性方面有一个强有力的基准时,多代理系统的标准化才能实现。"
Sheth 承认让 AI 代理实现互操作可能很复杂。AGNTCY "希望鼓励开发者根据需求扩展这些规范、API 和工具,而不是重新发明轮子,这对实现标准化至关重要。"
LangChain CEO Harrison Chase 在另一次对话中表示,创建标准并非不可能,尤其是现在构建代理本身变得更容易了。
"构建代理已经成为可能,而且正在进行中。Replit、Klarna、LinkedIn、Uber、Appfolio 等许多公司都已经做到了这一点。代理不是未来的事物,而是现在就存在。既然我们知道如何构建代理,下一步就是让它们相互连接。这就是标准代理协议将帮助实现的目标,"Chase 说。
既是平台又是语言
Pandey 认为 AGNTCY 不仅仅是一组代理代码。它还将允许客户发现来自运行 AGNTCY 标准的不同开发者的代理。
"客户可以在 AGNTCY 平台上将所有这些代理组合在一起,这样他们就可以在构建工作流程时进行发现、组合、部署和评估,"Pandey 说。
AGNTCY 仍然需要招募更多 AI 参与者来为平台添加新代理,并获得作为标准的发展动力。毕竟,要成为行业标准,需要大规模采用,以防止建立太多相互竞争的标准。
这就是像 AGNTCY 这样的项目面临的艰巨任务。Pandey 表示,该集体一直在与许多其他行业参与者交谈,他们希望在开发平台时获得尽可能多的观点。这需要时间。
与此同时,企业继续实验甚至部署 AI 代理。也许在未来,这些代理都能够相互交流。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。