重构工作令人疲惫不堪。随着企业软件开发者着手创建新一批应用程序(许多应用都针对AI进行了全新调整或重构),他们需要完成一系列架构任务,包括解决服务供应、安全性、连接性、集成和可观测性需求。其中大部分工作需要构建独立的AI智能体并对其进行指导。
即使开发者通过应用程序接口连接现有的AI智能体和服务来实现基础功能,在基础设施层面仍需要进行大量的身份验证和管理工作。
从智能体错误中学习
开发者社区的不足之处在于无法系统性地跟踪智能体如何以及在何处建立连接点,更关键的是,无法捕获和记录智能体在与其他IT服务互连过程中所执行的操作,以及这些连接在功能提取方面的成功程度。
"AI智能体通常会重复犯同样的错误……这对学习来说是件好事,"Composio首席执行官Soham Ganatra解释道。Composio是一家新成立的公司,致力于为AI智能体提供基础技能基础设施服务,帮助其在企业应用中学习和优化性能。"当开发者将智能体连接到Salesforce(或GitHub工作流程、数据库)等应用时,他们最终都会解决相同问题并提供相同背景信息。我们将这些知识存储为'技能',供其他开发者重复使用。当一个智能体首次学会使用Salesforce时,它会与所有其他与Salesforce交互的智能体分享这一知识。这样,所有智能体都会随时间推移而改进。"
Composio在成立首年就将其平台推向市场,该公司声称能够通过提供"技能基础设施"来填补AI生态系统的空白,使自主智能体能够更智能地与软件工具和工作流程交互。公司表示,可以将其服务组合视为自适应技能层,该技能层会在每次交互中提升直觉,自我优化行为,并随时间推移变得更加有用。
原始智能仍然是原始的
Ganatra认为,仅凭原始智能(即通过最先进的AI数据模型输入大语言模型,并由最快的图形或神经处理单元驱动的能力)只是拼图的一部分。他建议,只有当智能能够从与世界的交互中学习,融合其中的人类和机器时,才能产生商业影响。
"AI智能体将在日益强大的模型支持下变得更加智能,但真正的魔力在于赋予它们灵魂:将它们从工具调用机器人提升为理解你的目标和环境的系统,作为伙伴与你共同成长,"Ganatra说道。"我们正在构建自我优化的技能层,解决日益智能的大语言模型与能够从经验中进化、发展细致实用技能的智能体之间的根本差距。"
他进一步阐述,技能是智能体能力背后的基本构建块,从电子邮件撰写等基础任务到广告管理等复杂操作。不断演进的技能层会指数级提升系统的整体能力,使其能够处理日益复杂的问题而无需大量提示。
公司表示,在构建AI架构时,需要考虑"工具规模",即智能体要可靠且熟练,必须能够按需访问任何软件即服务端点。这需要一个包含数千个工具包的存储库。在技能适应方面,重复工作流程应从大语言模型引导的执行转变为快速、成文的例行程序,优化速度和可靠性。技能还应根据上下文在成文流程和大语言模型推理之间动态切换……这意味着如果某项任务不存在成文技能,系统会返回到大语言模型引导的执行。
通过其客户群中的Composio智能体,公司表示正在构建个性化的管理技能网络,这些技能能够从运营环境中学习。
"你可以花费数百小时构建大语言模型工具、调整提示和完善指令,但最终会遇到瓶颈,"Ganatra说道。"这些模型不会像人类员工那样在工作中不断改进。它们无法构建上下文、从错误中学习,或发展使人类工作者不可替代的微妙理解能力。"
Ganatra和他的团队坚持认为,他们在大约两年前就开始构建AI智能体服务,"早于目前的炒作"。公司成立的使命是解决AI领域的根本基础设施问题。团队解决了包括多智能体协调、企业系统间身份验证以及在基础设施流程中构建可扩展性等复杂挑战,以便每天处理数百万请求。该组织现在拥有超过100,000名开发者使用其平台,每天处理数千万请求。
竞争分析:智能体自动化
虽然Composio当然声称其"独特性"并将其智能体AI基础设施技术描述为独一无二的,但我们可以在IT市场的常见供应商以及争夺更多话语权的初创公司中找到一系列反映和呼应其方法的服务。
除了提供Davis AI服务的Dynatrace和提供Watsonx Orchestrate的IBM,智能体基础设施管理领域还聚集了来自New Relic、思科、Splunk甚至ServiceNow(一家以IT服务管理平台闻名的公司)的技术,后者的技术旨在赋予个人成为自身流程编排者的能力,并提供智能体功能来驱动服务发现和事故解决。
在大型企业中,数据库供应商Oracle通过其Agent Studio进入这一领域,这是一项用于在企业中创建、扩展、部署和管理AI智能体及智能体团队的技术。Oracle的应用场景相对更窄,但提供类似的"智能体成文化"服务,通过智能体模板库创建AI智能体,该服务使用预构建模板配合自然语言提示,或从现成模板库中选择以支持各种业务场景。同样来自科技巨头,微软AutoGen是一个开源编程框架,用于构建AI智能体并促进多个智能体间的协作,以解决工作场景任务。微软表示,AutoGen旨在提供灵活框架来加速"智能体AI的开发和研究",重点关注代码质量、稳健性、通用性和可扩展性。
该领域还有一些知名度较低(但可能同样优秀)的产品,如Tonkean的AI Front Door技术,它作为工作场景任务和智能体间的编排中心,在可审计的策略控制下运行。同样,这里的应用点更加狭窄,即Tonkean专门服务于法律和采购业务。范围稍广的Camunda以支持智能体技术的混合编排而闻名。该公司被认为"融合"了确定性流程模型与非确定性AI引导的决策制定。MuleSoft、AWS、UiPath等公司也都在这一领域运营。
不再需要回到学校?
如果构建智能体功能(本质上是通过功能快捷方式和智能加速器自动化我们的生活,消除繁重工作)的核心需求涉及在每次新构建时踩刹车回到学校重新学习,那么人工智能就存在某种矛盾的悖论。如果AI旨在封装自动化并提高效率,那么它在尝试运行时surely应该使用封装自动化本身。这绝非Composio的使命宣言,但确实可能是。
需要解决的核心问题是,语言模型接口传统上是为人类使用而构建的,而非为机器服务的无缝集成而设计。这意味着你喜爱的聊天、邮件、搜索或创作应用中的AI使用起来很有趣,但也意味着在引擎室的甲板下方进行着大量工作。没有人愿意在不必要时被油污覆盖,所以让我们为AI智能体本身考虑一下。否则,记得带洗手液。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。