重构工作令人疲惫不堪。随着企业软件开发者着手创建新一批应用程序(许多应用都针对AI进行了全新调整或重构),他们需要完成一系列架构任务,包括解决服务供应、安全性、连接性、集成和可观测性需求。其中大部分工作需要构建独立的AI智能体并对其进行指导。
即使开发者通过应用程序接口连接现有的AI智能体和服务来实现基础功能,在基础设施层面仍需要进行大量的身份验证和管理工作。
从智能体错误中学习
开发者社区的不足之处在于无法系统性地跟踪智能体如何以及在何处建立连接点,更关键的是,无法捕获和记录智能体在与其他IT服务互连过程中所执行的操作,以及这些连接在功能提取方面的成功程度。
"AI智能体通常会重复犯同样的错误……这对学习来说是件好事,"Composio首席执行官Soham Ganatra解释道。Composio是一家新成立的公司,致力于为AI智能体提供基础技能基础设施服务,帮助其在企业应用中学习和优化性能。"当开发者将智能体连接到Salesforce(或GitHub工作流程、数据库)等应用时,他们最终都会解决相同问题并提供相同背景信息。我们将这些知识存储为'技能',供其他开发者重复使用。当一个智能体首次学会使用Salesforce时,它会与所有其他与Salesforce交互的智能体分享这一知识。这样,所有智能体都会随时间推移而改进。"
Composio在成立首年就将其平台推向市场,该公司声称能够通过提供"技能基础设施"来填补AI生态系统的空白,使自主智能体能够更智能地与软件工具和工作流程交互。公司表示,可以将其服务组合视为自适应技能层,该技能层会在每次交互中提升直觉,自我优化行为,并随时间推移变得更加有用。
原始智能仍然是原始的
Ganatra认为,仅凭原始智能(即通过最先进的AI数据模型输入大语言模型,并由最快的图形或神经处理单元驱动的能力)只是拼图的一部分。他建议,只有当智能能够从与世界的交互中学习,融合其中的人类和机器时,才能产生商业影响。
"AI智能体将在日益强大的模型支持下变得更加智能,但真正的魔力在于赋予它们灵魂:将它们从工具调用机器人提升为理解你的目标和环境的系统,作为伙伴与你共同成长,"Ganatra说道。"我们正在构建自我优化的技能层,解决日益智能的大语言模型与能够从经验中进化、发展细致实用技能的智能体之间的根本差距。"
他进一步阐述,技能是智能体能力背后的基本构建块,从电子邮件撰写等基础任务到广告管理等复杂操作。不断演进的技能层会指数级提升系统的整体能力,使其能够处理日益复杂的问题而无需大量提示。
公司表示,在构建AI架构时,需要考虑"工具规模",即智能体要可靠且熟练,必须能够按需访问任何软件即服务端点。这需要一个包含数千个工具包的存储库。在技能适应方面,重复工作流程应从大语言模型引导的执行转变为快速、成文的例行程序,优化速度和可靠性。技能还应根据上下文在成文流程和大语言模型推理之间动态切换……这意味着如果某项任务不存在成文技能,系统会返回到大语言模型引导的执行。
通过其客户群中的Composio智能体,公司表示正在构建个性化的管理技能网络,这些技能能够从运营环境中学习。
"你可以花费数百小时构建大语言模型工具、调整提示和完善指令,但最终会遇到瓶颈,"Ganatra说道。"这些模型不会像人类员工那样在工作中不断改进。它们无法构建上下文、从错误中学习,或发展使人类工作者不可替代的微妙理解能力。"
Ganatra和他的团队坚持认为,他们在大约两年前就开始构建AI智能体服务,"早于目前的炒作"。公司成立的使命是解决AI领域的根本基础设施问题。团队解决了包括多智能体协调、企业系统间身份验证以及在基础设施流程中构建可扩展性等复杂挑战,以便每天处理数百万请求。该组织现在拥有超过100,000名开发者使用其平台,每天处理数千万请求。
竞争分析:智能体自动化
虽然Composio当然声称其"独特性"并将其智能体AI基础设施技术描述为独一无二的,但我们可以在IT市场的常见供应商以及争夺更多话语权的初创公司中找到一系列反映和呼应其方法的服务。
除了提供Davis AI服务的Dynatrace和提供Watsonx Orchestrate的IBM,智能体基础设施管理领域还聚集了来自New Relic、思科、Splunk甚至ServiceNow(一家以IT服务管理平台闻名的公司)的技术,后者的技术旨在赋予个人成为自身流程编排者的能力,并提供智能体功能来驱动服务发现和事故解决。
在大型企业中,数据库供应商Oracle通过其Agent Studio进入这一领域,这是一项用于在企业中创建、扩展、部署和管理AI智能体及智能体团队的技术。Oracle的应用场景相对更窄,但提供类似的"智能体成文化"服务,通过智能体模板库创建AI智能体,该服务使用预构建模板配合自然语言提示,或从现成模板库中选择以支持各种业务场景。同样来自科技巨头,微软AutoGen是一个开源编程框架,用于构建AI智能体并促进多个智能体间的协作,以解决工作场景任务。微软表示,AutoGen旨在提供灵活框架来加速"智能体AI的开发和研究",重点关注代码质量、稳健性、通用性和可扩展性。
该领域还有一些知名度较低(但可能同样优秀)的产品,如Tonkean的AI Front Door技术,它作为工作场景任务和智能体间的编排中心,在可审计的策略控制下运行。同样,这里的应用点更加狭窄,即Tonkean专门服务于法律和采购业务。范围稍广的Camunda以支持智能体技术的混合编排而闻名。该公司被认为"融合"了确定性流程模型与非确定性AI引导的决策制定。MuleSoft、AWS、UiPath等公司也都在这一领域运营。
不再需要回到学校?
如果构建智能体功能(本质上是通过功能快捷方式和智能加速器自动化我们的生活,消除繁重工作)的核心需求涉及在每次新构建时踩刹车回到学校重新学习,那么人工智能就存在某种矛盾的悖论。如果AI旨在封装自动化并提高效率,那么它在尝试运行时surely应该使用封装自动化本身。这绝非Composio的使命宣言,但确实可能是。
需要解决的核心问题是,语言模型接口传统上是为人类使用而构建的,而非为机器服务的无缝集成而设计。这意味着你喜爱的聊天、邮件、搜索或创作应用中的AI使用起来很有趣,但也意味着在引擎室的甲板下方进行着大量工作。没有人愿意在不必要时被油污覆盖,所以让我们为AI智能体本身考虑一下。否则,记得带洗手液。
好文章,需要你的鼓励
Colt科技服务公司推出超低延迟云连接服务Colt ULL DCA,专门面向加密货币交易商和AI应用开发企业的高速需求。该服务结合超低延迟网络和专用云接入平台,绕过公共互联网提供专用高速路径。在AWS亚洲区域测试中,平均延迟比原生路由降低15%。随着亚太地区数字资产交易成熟和AI需求爆发,企业对安全高性能连接需求激增,Colt正加速在东南亚扩张布局。
约翰霍普金斯大学研究团队开发了ETTIN模型套件,首次实现了编码器和解码器模型的公平比较。研究发现编码器擅长理解任务,解码器擅长生成任务,跨界训练效果有限。该研究为AI模型选择提供了科学依据,所有资料已开源供学术界使用。
皮尤研究中心最新分析显示,谷歌搜索结果页面的AI概述功能显著降低了用户对其他网站的点击率。研究发现,没有AI回答的搜索点击率为15%,而有AI概述的搜索点击率降至8%。目前约五分之一的搜索会显示AI概述,问题类搜索中60%会触发AI回答。尽管谷歌声称AI概述不会影响网站流量,但数据表明用户看到AI生成的信息后更容易结束浏览,这可能导致错误信息的传播。
博洛尼亚大学团队开发出情感增强的AI系统,通过结合情感分析和文本分类技术,显著提升了新闻文章中主观性表达的识别准确率。该研究覆盖五种语言,在多项国际评测中取得优异成绩,为打击虚假信息和提升媒体素养提供了新工具。