大语言模型的使用成本持续上涨,正让越来越多的企业陷入两难处境。随着AI模型变得日趋复杂,企业为每次查询所消耗的Token数量大幅增加,某些情况下甚至会产生灾难性的账单。
Pegasystems首席技术官Don Schuerman指出,由于AI模型存在固有的不可预测性,企业已无法准确预估每项任务的费用。同样的提示词,某天可能瞬间得到响应,而换一天提交几乎相同的内容,却可能耗时五分钟,并消耗掉每月Token预算的10%。
与此同时,许多企业鼓励员工最大化使用AI,却没有充分衡量其为组织带来的实际收益。这种"Token极限使用"的做法已让不少公司收到了意料之外的高额账单。例如,据Axios报道,某知名企业因未对员工的IT使用设置上限,仅在一个月内就在Anthropic的Claude AI平台上花费了超过5亿英镑的Token费用。今年4月,Uber的首席技术官也透露,该公司在今年前三个月已用完了原本为全年2026年预算所规划的Claude Code额度。
AI Token成本持续攀升
为数据中心融资的商业压力以及不断上涨的能源成本,促使AI供应商近几个月纷纷提价,令企业开始重新审视AI投入的真实价值。Schuerman表示,部分企业用AI取代人工之后才意识到,AI的费用甚至比被替代的员工成本还要高。
旧金山联邦储备银行行长兼首席执行官Mary Daly近期在接受彭博社采访时一针见血地指出:"数据中根本找不到生产力增长的踪迹。"
Schuerman在接受《Computer Weekly》采访时表示:"现在的模型已经变得更加复杂。它会自我推理,有时还会调度其他智能体来完成其他任务,整个过程中Token计费器一直在不停运转。"
企业逐渐意识到AI成本问题
他认为,企业正在逐渐意识到AI的成本并非随计算次数线性增长,而是"每增加一步,流程成本就会呈指数级攀升"。
Schuerman举例说明:如果用AI来处理一个业务流程,第一步可能消耗500个Token,但由于第一步的上下文需要传递到第二步,第二步就需要1000个Token,第三步则需要1500个Token,以此类推。
随着计算变得越来越复杂、所需上下文越来越多,不仅成本会持续上升,AI产生幻觉或出现不可预期行为的风险也会随之增加。
"AI最理想的用途,是帮助我把可重复执行的流程做对——帮我定义它、设计它、确保它遵循最佳实践。而事实证明,做到这些并不需要耗费太多AI资源。"
——Don Schuerman,Pegasystems
Pegasystems应对AI成本失控的策略,是以更具战略性的方式使用这项技术。Pega专为财富500强企业提供低代码平台,用于自动化业务流程及管理客户关系。本周,该公司宣布将按业务成果向客户收费,而非按AI Token用量计费。Schuerman认为,企业所需的大量高频、关键任务型流程中,至少有60%至70%可以通过基于规则的方法实现自动化。
"AI最理想的用途,是帮助我把可重复执行的流程做对——帮我定义它、设计它、确保它遵循最佳实践,"他说,"而事实证明,做到这些并不需要耗费太多AI资源。"
工作流设计
以Pega的Blueprint软件为例,它借助AI帮助用户为企业设计自动化工作流。由于AI的大量工作在设计阶段就已完成,AI智能体在每次流程执行时无需从零开始重新思考整个流程。
当然,这些工作流也可以调用AI智能体来执行特定任务,例如对文档进行摘要或向人工征询意见,让企业得以在受控环境下灵活运用AI的推理能力。
Pega现已使其自动化工作流与开源的模型上下文协议(MCP)兼容。这意味着,基于其他平台构建的AI智能体——包括Anthropic Claude、Google Gemini、OpenAI、AWS AgentCore等——都可以接入并调用Pega的业务流程。
Schuerman表示,对Pega而言,接入MCP的技术难度"相对较低"。Pega对企业如何访问其工作流保持中立态度。企业此前已可以通过Salesforce等其他软件访问Pega工作流,无需将Pega作为前端使用。
但对企业而言,这一变化意义重大。他们可以将现有的AI智能体接入Pega,直接按照既有工作流运作。
"一旦接入Pega的MCP,智能体就会遵循既定规则运行,无需进行过度推理,只需通过相对简单的调用找到正确的工作流和对应的技能,"Schuerman说。
从银行到披萨连锁
荷兰合作银行(Rabobank)等企业已在使用MCP调用,将聊天机器人升级为能够为客户完成实际任务的智能体,例如查询账户余额或发起支付。
Blueprint的推出也为更多企业提供了快速成为Pega客户的通道。过去,Pega开发原型工作流并等待企业决定是否采购,往往需要数年时间。
"通常需要经过漫长的沟通,也需要非常优秀的销售人员,才能帮助客户理解他们的业务问题如何与我们的平台对接,"Schuerman说。
而有了Blueprint,软件只需根据企业对自身业务的描述、扫描其官网上的相关资料,便可在数分钟内设计出切实符合业务需求的工作流。
Schuerman没有透露具体数字,但表示Pega已有意识地将平台推向更广泛的企业客户群体,部分直接销售,部分通过业务合作伙伴进行。此前,Pega主要服务于银行、保险公司和医疗健康等强监管行业,但如今,连锁披萨品牌棒约翰(Papa John's)这样的企业也出现在了Pega年度大会的与会名单中。
AI无法创造非凡
Schuerman坚持认为,随着企业自动化程度不断提升,AI并不会取代人类的创造力。与人不同,AI不会创造出真正卓越或富有创意的成果,"它只是在对过去所读到的一切进行平均化处理"。他表示,企业真正的目标,是"不断缩短从一个想法到这个想法切实改变员工工作方式、改变客户互动体验之间的时间"。
这样一来,人们就能腾出更多精力专注于战略制定、创意发想和创造性工作。Schuerman认为,业界过于关注下一代ChatGPT或Claude,而去年的版本其实已经完全够用。
"真正的挑战在于,如何把AI的所有潜力转化为对人们切实有用的现实成果——我认为那才是真正有价值的工作所在,"他说。
Q&A
Q1:Pegasystems的Blueprint软件是如何帮助企业控制AI成本的?
A:Blueprint软件利用AI帮助企业在设计阶段完成大量工作,提前设计好自动化工作流。由于流程在设计时已经固定,每次执行时AI智能体无需从头推理,大幅减少了Token消耗。企业只需在需要执行特定任务时(如文档摘要或人工审批)才调用AI,从而将AI的使用控制在必要范围内,有效降低成本。
Q2:Pega的MCP兼容功能对企业有什么实际意义?
A:Pega将自动化工作流接入开源的模型上下文协议(MCP)后,企业原本使用的Anthropic Claude、Google Gemini、OpenAI等平台上的AI智能体,都可以直接调用Pega的工作流。这意味着企业无需重新搭建流程,现有智能体就能按既定规则运行,避免过度推理,既提升了执行效率,也减少了不必要的Token消耗。
Q3:Pegasystems为什么选择按业务成果收费,而不是按Token用量收费?
A:Schuerman认为,按Token收费的模式导致企业成本难以预测,且容易产生超支。Pega改为按业务成果收费,是为了让客户的付费与实际获得的价值直接挂钩。这一转变也体现了Pega的核心理念:通过规则化、自动化的工作流减少对高成本AI推理的依赖,让企业在可控成本范围内实现业务目标。
好文章,需要你的鼓励
前沿AI研究机构Decart发布最新世界模型Oasis 3,旨在弥合虚拟仿真与物理AI之间的鸿沟。该模型将超写实交互图形能力与强大物理引擎相结合,可生成动作驱动的视频流,支持多视角环境模拟,延迟低于200毫秒。开发者能够借助自然语言提示,快速构建多样化极端场景,有效解决机器人和自动驾驶领域长期存在的"仿真到现实"差距问题,大幅降低物理AI训练成本。
OpenSkill是一套让AI代理无需人工监督即可自主成长的框架,通过从互联网获取知识、自建虚拟考题反复练习,实现真正的开放世界自我演化。
Visual Components正式发布5.1版本工厂仿真软件,重点引入高精度物理仿真与可扩展机器人协同调度能力,支持在同一环境中同时模拟数百台自主移动机器人、自动导引车及人员的运行状态。新版本还将仿真性能提升至前代的10倍,新增Allen-Bradley PLC支持及Nachi、Epson机器人虚拟调试插件,并将脚本环境升级至Python 3。该软件旨在帮助制造商在实际部署前完成系统验证,降低调试风险,缩短投产周期。
论文研究了AI评委同时优化多个评判维度时的两大失败原因:梯度稀释与指令干扰,为多目标提示词优化提供了系统性诊断框架。