大家都在讨论企业 AI 代理,但很少有人真正准备好实现它们所需的全部条件。
成千上万的初创公司正在构建专用于狭窄任务的代理,尤其是面向客户的任务。但是,真正的企业转型不仅仅依靠推出聊天机器人——它需要整合智能系统以指导行动、记录系统以执行操作以及交互系统以提供可用体验。Salesforce Inc. 是唯一一家构建这一完整堆栈的主流企业。
在最近的一次采访中,我与 theCUBE 的 Dave Vellante 一起与 Salesforce 联合创始人、董事长兼首席执行官 Marc Benioff ( pictured ) 进行了对话,探讨该公司如何为代理时代重新构建企业软件。Benioff 阐述了为何这种“下一次演进”——从软件即服务 (SaaS) 向服务即软件 (SaSo) 转变——比 15 年前开启的云计算和移动浪潮更具颠覆性。云计算使应用程序成本更低、获取更便捷;而企业 AI 代理结合人工监管,则彻底重新定义了这些应用程序的运行方式。
以下是我们对话的亮点。
如何让企业 AI 代理助力提升人类生产力
Benioff 将当下的热情比作 Salesforce 早期初创时期的景象。他表示,目前的 CEO 代表着“最后一代只依靠纯人工劳动力的高管”。他正在 Salesforce 内部积极推动这一愿景,目标是在工程、服务和支持等职能中通过“代理层”实现 50% 的生产力提升。
他预计这种增长将年复一年地持续叠加,这正是企业 AI 代理的一个关键承诺。
数字劳动力市场
虽然 Salesforce 今年通过其 SaaS 业务将产生约 409 亿美元的收入,而整个企业软件行业规模约为 5000 亿美元,但数字劳动力市场的规模可能达到 3 至 12 万亿美元。企业 AI 代理以及基于代理的数字劳动力将 SaaS 转变为 SaSo。
这一变化代表了一种根本性转变,正如例如 OpenTable Inc. 的客户案例所展示的那样,其生产力提升是“一两年前根本无法实现”的。客户和合作伙伴将能够通过一个类似于 Apple App Store 的代理商店来交换这些服务。
Salesforce 整合 vs DIY
Salesforce AI 战略的架构基础由三个深度集成的层次构成。Salesforce 正在“下大力气”重写并深度整合 Data Cloud 内的核心应用。
Data Cloud 整合了来自外部和 Salesforce 源的数据,从而提供一个丰富的 4D 业务状态图。以 Tableau 为例,它在 Data Cloud 上重建,实现了 Sales Cloud、Service Cloud 以及其他应用之间的流动性。这种整合使得 Tableau 能够出现在其他应用中,甚至嵌入到 Slack 内。再加入 Agentforce(第三层)就构成了完整的架构。
另一种选择是那些颇具实力的组织尝试 DIY 的整合工作,但即便如此,它们也很难达到同样的可靠性——尤其是在大规模构建和部署企业 AI 代理的情况下。
成为纯软件超大规模交易商
Salesforce 正在朝着成为“纯软件超大规模交易商”的方向发展,提供云级别的应用与平台能力,而无需建立实体数据中心。Salesforce 提供“数据流动性”,即将数据与其他数据平台及孤立的应用进行联合。但是,当数据进入 Data Cloud 后,数据网络效应会使数据得以丰富,远比之前封闭在各自孤岛中的数据更具价值。
例如,迪士尼的一位客户如今实现了“代理流动性”,数千名主题公园游客所依赖的企业 AI 代理能够同时访问客户偏好、游乐设施可用性数据以及多个系统中的其他信息,从而提供人工工作人员难以协同完成的推荐。
回应 Nadella 关于代理将使 SaaS 消失的论调
几个月前,微软 CEO Satya Nadella 曾在网络上引发热议,他建议企业 AI 代理直接访问数据库架构将使 SaaS 消失。这听起来更像是在挑衅。“若仅仅通过某种法律发现 API 将所有数据倾倒进一个大型存储库,再让所有员工在其中乱窜,必然会引发重大问题。”
治理数据和通过元数据对数据进行定义的要求不会因为 AI 代理的出现而消失。必须有一个确定性的软件层来调控访问,同时叠加非确定性的代理能力。我们对他将 Microsoft 365 Copilot 描述为 Clippy 的说法提出了质疑,但他表示 Salesforce 也将能够将这些数据联邦整合到 Data Cloud 中。至于是否会迎来 Klarna 时刻,Benioff 并不愿意给出具体时间框架。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。