如果说2025年是智能体人工智能实验和试点的一年,那么2026年正在成为智能体在企业运营中找到永久归宿的一年。
根据本周在伦敦AI与大数据博览会上Salesforce Inc.和DeepL SE等公司在简报中提供的数据,应用案例正在迅速扩展。这一势头得益于智能体自身运作的加速改进,包括智能性和可观察性等关键指标的提升。随着企业将智能体部署到基础设施中,生产力提升正被证明是一个主要吸引力。
"为了获得支持,我们需要真正关注那些能够产生实际影响的事情,"Salesforce解决方案工程高级副总裁Paul O'Sullivan在周三的会议小组讨论中说道。"将AI与生产力提升联系起来非常容易。我认为我们有一个千载难逢的机会来重新构想我们如何经营业务。"
获得企业立足点
飞往伦敦希思罗机场参加本周AI会议的与会者有机会体验到智能体如何开始改变旅行体验。这个世界第四繁忙的机场使用Salesforce设计的名为"Hallie"的智能体来回答签证问题并告知乘客安检等待时间。
"他们已经将70%的客户互动转移到智能体上,"O'Sullivan告诉与会者。"希思罗机场现在可以提供24/7服务。"
AI解决方案提供商DeepL的高管们提供了进一步证据,表明智能体正在获得企业立足点。DeepL产品营销副总裁Scott Ivell告诉SiliconANGLE,这家德国公司在全球有2000个客户部署AI智能体。它们被用于广泛的目的,包括报告分析、创建销售目标列表和检查法律文件中的关键合同条款。
"我们相信这是将人类从重复性工作中解放出来并提高生产力的方式,"Ivell说。"我们希望推出真正可用的企业应用案例。"
智能体的上下文理解
企业应用案例的扩展得益于更短的实施周期和对AI智能体可以带来的生产力提升的强烈兴趣。
DeepL和Salesforce的高管们表达了一致意见,即根据所涉及的任务和数据的可用性,智能体可以在几天或几周内实施。这不是一个繁重的基础设施工作。然而,就像增加一名新员工一样,它们可能需要一段时间才能成为完全的贡献者。
"让智能体启动和运行很容易,"O'Sullivan说。"我如何让这个智能体真正有效?我看到的是需要几周时间。你的智能体是你劳动力的延伸。"
还有另一个重要因素推动企业采用AI智能体。在惊人的短时间内,智能体已经提升了它们的能力。智能体越能理解上下文,它们就越能成为劳动力中更有生产力的贡献者。
当智能体捕获推理数据时,这些数据会被写入Salesforce Data 360(原Data Cloud)。Salesforce去年收购Informatica使其能够将两家公司的元数据与Data 360的实时上下文相结合,用推理替代智能体的猜测。
当SiliconANGLE问及智能体是否变得更聪明时,O'Sullivan说:"我们开始为智能体带来上下文智能。我们看到的是智能体现在直觉上得出结论的速度快得多。"
超越大语言模型
从大数据与AI聚会的对话中出现的一个关键主题围绕企业采用大语言模型。
许多企业已经通过大语言模型及其填补知识空白的能力接受了生成式AI。然而,大语言模型服务也带来了高运营成本、使用公开可用平台时的数据隐私风险,以及微调大型模型以满足业务需求所涉及的固有复杂性。
在企业界有一种看法,即尽管大语言模型足以满足消费者领域的需求,但它们可能并不总是企业的最佳选择。"足够好并不够好,"Ivell指出。
Salesforce通过寻求对智能体AI在企业环境中如何运作的更大控制来解决这个问题。AI需要连接到准确的数据、业务逻辑和治理,以产生大语言模型原始智能所能提供的可信、可预测的结果。
Salesforce通过Agent Script解决了这个问题,这是一种基于JavaScript对象表示法的语言,允许企业定义复杂的确定性工作流。这通过集成确定性规则与智能体推理为智能体构建者提供了精确控制。
"仅仅大语言模型是不够的,"O'Sullivan解释说。"AI必须连接到一个系统。"
专注于可观察性
会议上讨论的另一个关键话题是可观察性。一旦AI连接到可信结构中,企业需要监控并完全理解智能体正在采取的行动。对于管理数万亿美元交易的企业来说,风险太大,比如信用卡巨头Visa Inc.,该公司已承诺采用生成式和智能体AI。
"如果不被追踪,就不应该被执行,"Visa欧洲全球数据解决方案副总裁Konstantina Kapetanidi在周四的演讲中说。"我们不再在黑盒中运作。我们在这里提供答案和解释。"
1月,Salesforce发布了MuleSoft Agent Fabric的增强功能,为AI智能体、工具和元数据提供单一控制平面。Agentforce Observability还为用户提供了深入挖掘每个智能体交互的能力。"现在的可观察性是在你经营业务的智能体和人员的上下文中,"O'Sullivan在采访中说。
Salesforce、DeepL和Visa等公司正在亲身体验智能体AI如何迅速改变企业格局。这个领域发展迅速,现在的重点是如何以信任和信心部署AI智能体,相信业务会因此得到可衡量的改善。未来的某个时点,智能体也有可能只是成为数字化设施,成为基础设施中被接受但无人真正注意的一部分。
"我们看到在推动业务的主要杠杆方面有了牵引力,"Ivell说。"智能体将会崭露头角。然后它们将消失在背景中。"
Q&A
Q1:Salesforce的Hallie智能体是什么?它在希思罗机场发挥什么作用?
A:Hallie是由Salesforce设计的智能体,被世界第四繁忙的希思罗机场使用。它主要用来回答乘客的签证问题并告知安检等待时间,已经承担了70%的客户互动工作,使机场能够提供24/7全天候服务。
Q2:企业部署AI智能体需要多长时间?实施难度大吗?
A:据Salesforce和DeepL的高管表示,智能体可以在几天或几周内实施,具体取决于所涉及的任务和数据的可用性。这不是一个繁重的基础设施工作。不过就像新员工一样,智能体需要几周时间才能成为完全有效的贡献者。
Q3:为什么企业认为仅有大语言模型还不够?需要什么额外支持?
A:虽然大语言模型在消费者领域表现良好,但企业需要更高标准。大语言模型存在高运营成本、数据隐私风险和复杂性等问题。企业需要将AI连接到准确的数据、业务逻辑和治理系统,以产生可信、可预测的结果。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。