忽视智能体AI的潜力,特别是其对现代化数据基础设施的需求,承担着与当年零售商忽视互联网同样的生存风险。问题不在于是否投资,而在于如何确保这些投资转化为可衡量的、真实世界的回报。但是衡量智能体AI投资的实际回报率可能令人困惑。那么,在确保可衡量成功的同时,你应该如何为智能体AI的未来做好定位呢?
明确你的目标
对于企业来说,这是一个超越AI试验阶段的关键时刻。为了实验而实验的时代已经结束。今天的模型功能强大,但它们的价值取决于所要实现结果的明确性。如果对业务目标缺乏清晰理解,即使是最先进的AI能力也可能成为昂贵的科学项目。现在是时候明确成功的定义,并有意识地朝着这个目标构建了。
例如,智能体现在可以管理治理、编排流水线、加速入职流程并增强客户参与度。一些好处很容易量化,比如营销转化率提升15%或入职时间缩短40%。其他好处更具结构性,如优化资源利用和消除冗余工具。在开始时,确定哪些用例能在最短时间内产生最大影响,并以此为基础构建。
治理:投资回报率的根基
那么,如何在AI策略中建立更具体的投资回报率目标呢?
这始于治理。治理不仅仅关乎合规性;治理智能体主动执行政策,动态检测架构漂移,并实时精确定位血缘关系缺口。这为开发人员和评估结果的高管创建了可信的反馈循环。
成功的组织不会固守单一的大型AI用例。他们在整个技术栈中嵌入智能体,从面向客户的应用程序到用于治理、数据质量监控和工作负载优化的内部系统。然而,没有对数据的强有力掌控,理解这些智能体的成就,更重要的是衡量其投资回报率,就变得不可能。
正如投资者兼作家罗伯特·清崎所说:"富人不为金钱工作;他们让金钱为他们工作。"类似的原则适用于你的数据。当你的数据具有敏捷性、清洁度并主动为你工作——改善决策、训练复杂系统并驱动自主智能体时——AI的投资回报率就不仅仅是理论上的,而是真实的。
最成功的早期采用者是有意识地构建治理的。他们投资于元数据系统、自动化和基于领域的组织。这创造了效率,从消除冗余数据管道到加速交付。回报并不总是立即显现,但它是基础性的。强健的治理将原始数据转化为可靠、可用的产品,使智能体能够提供一致、可重复的价值。
跨技术栈衡量投资回报率
投资回报率可以在许多地方出现,而且并非所有地方都相同。
在业务方面,智能体AI已经在产生影响。营销团队使用生成式智能体进行超个性化营销活动,而销售和支持团队部署的副驾驶显著改善了响应时间和客户满意度。这些直接加速了收入和关键绩效指标。例如,我最近与一家金融服务公司交谈,他们使用生成式智能体个性化入职流程,将客户设置时间从两周缩短到三天,同时将转化率提高了20%。
在供应端,AI智能体正在优化基础设施,显著减少手工工作,并降低风险。这包括自动化复杂治理、改善可观测性,以及智能调优工作负载以减少支出。这些效率提升通常比面向客户的改进更快显现。
一个常见的反模式是平台碎片化。当团队采用重叠工具时,隐性成本会积累。无论你运行统一平台还是混合环境,通过减少重复和整合工作负载都能获得显著的投资回报率。互操作性很重要。当智能体跨系统运行且治理保持一致时,计算和运营成本都会下降。最敏捷和最成功的企业会不断精简其核心平台。
将AI投资回报率视为一个连续体。一些投资产生即时回报,另一些建立长期价值。关键是了解你所处的位置以及要衡量什么。
从猜测到指导
不要将AI仅仅视为削减成本的工具。它更深层的机会是横向的:帮助团队移动更快、创新更多,并专注于更高价值的工作。然而,这种好处只有在你的数据准备就绪时才会显现,而这种就绪性始于治理。
通过使投资回报率可见和可追踪,治理本质上打破了分散努力和稀释结果的组织孤岛。它建立了一个共享框架,直接将数据投资与公司范围的OKR对齐。在这个智能体AI时代,投资回报率不是仪表板上的静态数字;它是等待在你的企业中被捕获的分布式力量。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。