生成式人工智能已是2024年的热点话题。如今我们即将度过2025年的大部分时光,所有AI热议都围绕着智能体AI展开。
AI智能体——由大语言模型驱动的自主软件程序,能够从多个数据源迭代学习以实现既定目标——现在正吸引着所有关注。
显而易见的问题是:这些热议中有多少是炒作?是否存在真正有效的智能体平台,能够利用AI智能体的变革性质以全新方式解决商业问题?
为回答这个问题,我采访了几家已在泡沫中脱颖而出的供应商,它们在智能体AI领域建立了早期领导者声誉。
以下是我的发现:
客户支持智能体
鉴于生成式AI在为聊天机器人提供人类语言界面方面的成功,专注于客户支持的智能体平台是一个显而易见的起点。
Sendbird公司提供完全专注于客户支持的智能体AI平台。它可跨多个通信渠道工作,包括Instagram和Facebook Messenger。
Sendbird能够发起自主支持和销售对话,同时让人类参与处理更复杂的询问。然后它主动重新联系终端客户,使Sendbird的客户能够提供自动化的"个人礼宾"服务,甚至面向大众市场客户。
该平台提供自己的单元测试框架以及安全、隐私和合规能力,为客户与基于AI的服务交互提供必要保障。
MavenAGI公司的智能体AI平台也专注于改善客户体验。它能解决支持工单,在90%以上的时间里回答客户询问。
MavenAGI具有广泛的多模态支持,可跨副驾驶、聊天机器人、网络搜索、语音、电子邮件、WhatsApp、短信、Slack和Teams工作,并通过应用程序编程接口提供服务。MavenAGI的智能体足够智能,能够跨不同行业解决大多数客户问题,例如错误商品配送、欺诈警报或航班取消。
该公司的语音智能是重要差异化因素,因为MavenAGI提供语音转文本和更具挑战性的语音对语音能力。这些语音能力支持其广泛的电话和呼叫中心集成。
解决部门挑战的智能体
客户支持只是智能体AI建立立足点的众多领域之一。我研究中最有趣的结论或许是AI智能体如何解决企业多个部门的挑战。
Auditoria.ai公司为财务运营(FinOps)提供智能体AI平台。因此,该公司瞄准首席财务官——众所周知对软件采购持怀疑态度的买家。
然而,Auditoria智能体的智能特性已经说服了许多犹豫的CFO。智能体接管许多日常FinOps任务,如管理沟通、数字化文档和处理状态通知。
最让CFO信服的是Auditoria的AI驱动自动化,它能处理发票、收款、汇款和帮助台流程,释放人员专注于更战略性任务。
7AI公司为网络安全分析师提供智能体AI平台。该公司的智能体利用来自多个来源的警报和其他传入数据执行安全调查、得出结论并卸载重复性任务。
该公司提供所谓的"群体智能体"。基于提供动态即时生成智能体方法的技术,该平台可为任何特定客户提供数百或数千个智能体。
7AI智能体可以确定性或非确定性方式运行。例如,它们确定性地处理警报分类,但在基于研究各种数据源创建缓解措施时采用非确定性方法,包括人员先前记录的部落知识。
Rox Data公司将其智能体AI平台专注于收入运营——特别是销售生产力。Rox正在寻求用其"智能体群"方法重新发明客户关系管理市场(以及与Salesforce和其他CRM应用集成)。
Rox智能体群的基础是基于数据湖的记录系统,支持连接多个来源数据的知识图谱。Rox的智能体为进入市场人员处理众多任务,包括研究、跟踪以及对组织架构和机会的理解。
最后,Resolve AI公司将其智能体AI平台专注于信息技术运营,本质上提供基于智能体AI的系统可靠性工程师或SRE。
该平台处理所有警报,执行问题根本原因分析,然后排除故障,充当人类操作员的待命资源。Resolve利用实时维护所有基础设施依赖关系信息的知识图谱。这个知识图谱理解完整的企业生产环境。
智能体持续监听警报流并从多个来源收集证据,生成关于问题根本原因的假设。然后它迭代测试所有此类假设以发现最可能的原因。
虽然Resolve主要专注于生产环境,开发人员也可以使用其智能体在开发过程中排除故障。
面向所有人的智能体
虽然一些智能体平台专注于特定部门需求,但也有一些产品寻求满足整个组织员工的需求。
NinjaTech AI公司提供SuperNinja,这是一个通用AI智能体,充当知识工作者、编程员、分析师和研究员等角色。
SuperNinja安装托管智能体的Linux虚拟机,可在沙盒模式或基于云的部署中运行。客户随后可将虚拟机移植到他们选择的环境中。其能力广度是最显著特征。它可以构建网站、生成PowerPoint幻灯片、分析电子表格、自动化流程等——全部在单个智能体内完成。
除SuperNinja外,NinjaTech还提供几个可处理单独任务的简单智能体。实际上,NinjaTech的智能体分为三类——简单、复杂和自主——从而匹配每个任务的复杂性水平。
Glean Technologies公司提供智能体AI平台,使任何员工都能构建和运行自己的智能体。
Glean通过提供基于AI的搜索开始其智能体AI之旅。它很快添加了基于大语言模型的AI助手,即聊天机器人。现在该公司提供完整的智能体AI平台,利用Glean在搜索和AI助手方面的深厚专业知识。
Glean提供任何人都可使用的无代码界面来构建智能体。此外,该公司为开发人员提供快速构建智能体的低代码能力,以及当低代码不足时通过API和SDK提供的"专业代码"能力。
在底层,Glean最重要的差异化是其知识图谱如何跟踪它追踪的每个数据元素的细粒度权限。这种全面的权限基础设施使员工能够构建各种强大的智能体,同时符合隐私、安全和合规政策。
然而,员工可能构建的智能体类型可能是轻量级的点解决方案,在整个组织中提供的价值有限。
相比之下,Moveworks公司提供智能体AI平台,为整个企业员工队伍提供智能体AI助手,包括IT、人力资源、财务、工程、销售、营销和其他所有人。
Moveworks智能体可以自动化即使最复杂的企业级业务流程。
除了所有平台提供的聚合和基于行动的智能体外,Moveworks还提供"环境"主动智能体,持续运行,监控与其目标相关的信息。
然而,其最重要的差异化因素是管理所有智能体的推理引擎,迭代学习、实验和构建智能体工作流。Moveworks的能力如此令人印象深刻,以至于ServiceNow公司今年早些时候宣布收购该公司。
智能体开发者平台
虽然开发人员可以使用上述许多平台创建和部署AI智能体,但一些杰出供应商完全专注于开发人员需求。
来自Staf公司(又名Agency)的AgentOps.ai为构建、调试和部署AI智能体及其他基于大语言模型的应用程序提供开发者平台。该平台还为开发人员提供智能体行为的可观察性。AgentOps使开发人员能够从故障点重启智能体,从而加速调试/修复过程。
在这个类别中,来自Kepler Software公司的Mastra提供利用其开源Gatsby JavaScript堆栈的TypeScript智能体框架。
Mastra提供开发人员期望的智能体开发框架的一切,包括统一提供商API、RAG支持、灵活内存、提示调优和工具调用——全部使用TypeScript,这是JavaScript的流行强类型扩展。
现在"全力投入"智能体AI的转型者
我还发现了一些值得注意的供应商例子,这些公司我多年来与之交谈过几次,现在已转向智能体AI。
来自Lightbend公司的Akka将成熟的Akka无服务器、消息驱动反应式运行时扩展到智能体AI世界。今天,Akka是构建、运行和评估智能体系统的平台,包括编排、内存和流媒体能力。Akka智能体为开发人员提供智能体系统的设计模型和运行时,帮助他们定义智能体如何收集上下文、推理和行动。
SnapLogic公司利用其作为低代码企业集成平台的悠久历史,为开发人员提供智能体集成平台,以集成AI、数据、应用程序和服务。它现在提供AgentCreator低代码工具,用于创建和部署AI智能体。AgentCreator支持多个大语言模型,并提供智能体评估、可观察性和数据安全能力。
这个类别如果不提及UiPath公司就不完整,该公司在机器人流程自动化市场享有当之无愧的领导者声誉。其机器人为众多企业处理遗留集成和自动化,尽管机器人的主要缺点是脆弱性和增加技术债务。
因此,该公司已转向智能体AI,利用大语言模型支持灵活自动化所必需的自主行为。然而,UiPath最重要的差异化因素仍然是其RPA机器人,当访问遗留应用程序和数据源对构建智能体工作流很重要时,它现在将这些机器人编排到智能体工作流中。
**结论**
本文中14家供应商的共同点是,它们都拥有完全功能性的智能体产品——没有虚张声势或"智能体洗牌"。
此外,这个列表只触及表面。我的研究发现了几家其他供应商,我可能同样容易包括在内。因此,结论是智能体AI是真实的,并将持续存在。
诚然,它仍然是一项新兴技术,周围有很多炒作。但正如这些供应商所展示的,智能体平台及其支持的智能体今天正在解决商业问题——此外,正在改变软件解决复杂商业需求的方式。
Q&A
Q1:智能体AI与传统的生成式AI有什么区别?
A:智能体AI是由大语言模型驱动的自主软件程序,能够从多个数据源迭代学习以实现既定目标,而传统生成式AI主要用于内容生成。智能体AI具有自主性和学习能力,能够持续优化和改进,解决更复杂的业务问题。
Q2:智能体AI在哪些业务领域应用最广泛?
A:目前智能体AI在客户支持、财务运营、网络安全、收入运营和IT运维等领域应用最为广泛。例如,Sendbird专注客户支持智能体,能跨多平台提供自主服务;Auditoria针对财务运营,自动化发票和收款流程;7AI则为网络安全分析师提供智能调查和威胁缓解能力。
Q3:企业如何选择合适的智能体AI平台?
A:企业应根据具体需求选择平台。对于客户服务需求可选择Sendbird或MavenAGI;财务部门可考虑Auditoria;需要全员使用的可选择Glean或Moveworks;开发团队则可选择AgentOps或Mastra等开发者平台。关键是选择有实际功能产品,避免"智能体洗牌"的供应商。
好文章,需要你的鼓励
微软与三星达成合作,将Copilot人工智能助手集成到三星的智能电视和显示器产品中。用户可以通过语音或遥控器直接与Copilot交互,获得智能问答、内容推荐、设备控制等服务。这一合作标志着AI助手从传统计算设备向家庭娱乐设备的进一步扩展,为用户提供更加智能化的观看体验。
成均馆大学团队开发出选择性对比学习新方法,让机器通过观察人类交互场景学会识别物体功能部位。该技术突破传统局限,采用动态学习策略,能根据信息质量调整学习方式,在多个数据集上显著超越现有方法,为机器人、自动驾驶等领域的智能交互应用奠定重要基础。
在全球经济不确定性增加的背景下,AI创新竞赛正在加速进行。但许多企业仍缺乏执行工具:Gartner预测到2027年,60%的组织将因数据治理问题而无法实现AI用例的价值。企业需要统一的数据平台支持所有数据模型,建立可靠的AI就绪数据管道,并通过主权AI工厂标准化AI流水线。通过集成向量数据库、嵌入管道和模型服务,企业可将生产就绪应用的部署时间从数月缩短至数小时,实现完整的数据主权和治理。
新加坡南洋理工大学研究团队开发出EgoTwin系统,这是首个能够根据文字描述同时生成第一人称视频和匹配人体动作的AI框架。该系统通过创新的头部中心动作表示方法和因果交互机制,解决了视角对齐和动作画面同步的核心难题,在17万样本的真实数据集上实现了显著性能提升,为VR内容创作、影视制作等领域提供了新的技术可能。