AI成本危机终于有了监管机构,只是并非由制造问题的公司来主导。
AI正在成为企业规模最大、最难掌控的技术支出,这已不是什么秘密。对许多公司而言,花钱的速度远远超过了问责的能力。
有鉴于此,Linux基金会于周三宣布,计划成立Tokenomics Foundation——一个新的机构,专门负责在整个AI Token经济体系中建立开放标准、基准测试和最佳实践,涵盖从生产、消费到货币化的全链路环节。
该基金会预计将于6月下旬在圣地亚哥举行的FinOps X大会上正式启动,届时其领导层将就技术路线图及相关工作组进行详细介绍。目前,该基金会已获得来自业界广泛的初步支持,参与方包括谷歌、微软、IBM、摩根大通、毕马威、甲骨文和Salesforce等。
什么是Token
对于不太熟悉这一概念的读者来说,Token是AI模型处理文本时所使用的基本单位,它处于AI经济体系每一个层级的核心位置:模型以Token为单位进行运算,数据中心以Token为单位进行计费,而企业最终也以Token为单位付费并从中获取价值。
然而,Token并不像财务团队过去处理过的任何一种成本类别,即便是曾经花了多年才摸清规律的云计算,其使用模式也比Token更具可预测性。
成本增长速度令人震惊
今年4月,金融科技巨头Ramp宣布开始从AI服务商处提取Token级数据,目的是帮助财务团队清晰了解AI成本的来源和分配方式。这一举措的背后,是一个日益突出的矛盾:与传统软件合同不同,AI成本与使用量直接挂钩,费用可能在短时间内急剧攀升。
Ramp的内部数据显示,自2025年1月以来,月均Token支出增长了13倍,重度用户的成本在单季度内涨幅超过50%。
高盛5月发布的数据印证了这一趋势,预测全球Token使用量将在2026年至2030年间增长24倍,到2030年每月将达到120千万亿(quadrillion)Token。
这一增长轨迹已经在重塑AI产品的定价和销售方式。GitHub本周宣布放弃Copilot的固定订阅模式,转而采用基于Token的计费方式,这是旧有经济模式难以为继的最直接信号。随着智能体编程会话变得越来越长、越来越耗费资源,GitHub所承受的推理成本持续攀升,最终无法维系。
这一变化在社区内引发了强烈反弹,部分Copilot订阅用户将其斥为"钓鱼式促销",并反映其预计月度账单一夜之间飙升至原来的十倍。
Tokenomics Foundation的使命
正是为了解决这种焦虑,Tokenomics Foundation应运而生——它的目标是为目前对买卖双方而言都高度不透明的成本结构引入秩序。
FinOps Foundation执行总监J.R. Storment在接受The New Stack采访时指出,碎片化是核心问题之一。
"每家超大规模云服务商、每家模型提供商、每家硬件供应商都有自己的方法、自己的数据、自己的价值衡量指标,"Storment说,"我们的目标是像以往一样,在各方之间建立一致的模型。"
Tokenomics Foundation将与FinOps Foundation紧密合作。FinOps Foundation是一家非营利组织,自2020年起作为Linux基金会的一部分,致力于构建云成本管理的共同方法论。其希望将同样的思路应用于AI领域,将FinOps对云账单所施加的严格管控,同样延伸至Token支出。
但这一类比也有其局限。Token经济引入了云计算从未面临过的复杂性:输入Token与输出Token定价不同,缓存Token的计费方式也不相同,加之不同提供商之间的定价结构差异显著,使得供应商之间的横向比较异常困难。
在随公告发布的新闻稿中,Salesforce首席可用性官Nishant Gupta认为,Token经济在本质上比云成本管理更为复杂,需要整个行业开展集体实验并汇聚各方成果,而不是让各家公司各自为战、重复造轮子。
"Token经济在根本上比我们以前在这一规模上管理过的任何事物都更抽象、更不透明,"Gupta表示,"它需要一种与云时代所构建的运营能力完全不同的新能力,而这种能力应当通过业界广泛的实验共同发展,将最佳创意和实践贡献出来,从而共同建立持久的标准。"
标准框架与参与方
尽管大量运营细节尚未公布(更多具体信息预计将于6月8日的FinOps X大会上披露),但该基金会的整体框架已初具雏形。一个技术委员会将负责制定衡量和报告Token成本的通用规范与基准测试,其中包括将FOCUS(一种已在各大云服务商中使用的开放计费格式)扩展至AI Token支出领域。一个治理委员会则将负责制定战略方向并分配资源。
创始支持者名单涵盖了AI经济的各个层面:埃森哲、Booking.com、Flexera、谷歌云、IBM、摩根大通、毕马威、微软、甲骨文、Salesforce、SAP和ServiceNow均已初步加入。不过,当被问及谷歌和微软等企业是否提供资金支持以及支持力度时,基金会发言人表示相关事宜仍在各方评估之中。
值得注意的是,定价问题的核心当事方——前沿模型提供商——却明显缺席,Anthropic和OpenAI均未出现在初始支持者名单中。这一点不容忽视:正如近期一项针对Token定价危机的分析所揭示的,企业预算已在前沿模型高昂成本的重压之下不堪重负。Uber首席技术官近日透露,该公司2026年的AI预算仅用了四个月便已告罄,主要原因是旗下工程团队大规模采用Claude Code导致费用激增。
正是这种压力,是Linux基金会此番努力试图化解的根本所在——目前各组织缺乏统一、中立于供应商的方式来核算费用、跨供应商比价,或就AI部署做出知情决策。
"我们以前就做到过"
当然,房间里的大象依然无法回避:不同模型和供应商之间的Token定价差异极大——输入Token、输出Token、缓存Token各有不同,乘数不同,结构各异。如何在此基础上构建通用标准?如何让不在谈判桌上的前沿模型提供商也愿意接受这套标准?
Storment认为,云计算的先例颇具参考价值——各大超大规模云服务商当初并没有参与FOCUS的起草,但当客户提出需求后,它们全都采纳了这一标准。
"我们以前就已经在云上做到过这件事——我们制定了云账单数据的统一框架和规范,现在每一家超大规模云服务商都支持这些标准,"Storment说,"这些云厂商一开始并不在谈判桌上,但由于其客户都在,它们最终都加入进来了。我们预计在这里也会出现同样的模式。"
也许比标准本身更具意义的,是此刻坐在谈判桌旁的是哪些人。如今,全球最大的一批AI支出方已汇聚于同一平台,该基金会有机会在市场被各供应商单方面主导的局面固化之前,先行建立起共同框架。
"大型Token消费者携手就最大化Token服务消费价值的最优方案达成共识,将是在框架、指标和高效使用指南方面取得的最快胜利,从而推动商业价值的实现,"Storment补充道。
更正说明:本文早前版本将Tokenomics Foundation描述为专注于AI Token消费经济学,实际上该基金会的覆盖范围涵盖完整的AI Token经济——生产、消费与货币化三个维度。
Q&A
Q1:Tokenomics Foundation是什么?它要解决什么问题?
A:Tokenomics Foundation是由Linux基金会发起成立的新机构,目标是为整个AI Token经济建立开放标准、基准测试和最佳实践。它要解决的核心问题是:企业在使用AI时,Token计费方式因供应商而异,成本不透明、难以比较,导致预算管理极为困难。该基金会希望通过制定统一框架,帮助企业清晰掌握AI支出。
Q2:企业的AI Token支出增长有多快?
A:根据Ramp的内部数据,自2025年1月以来,企业月均Token支出增长了13倍,重度用户单季度成本涨幅超50%。高盛预测,全球Token使用量将在2026至2030年间增长24倍,届时每月使用量将达到120千万亿Token。Uber的案例也印证了这一趋势,其2026年AI预算仅用四个月便全部耗尽。
Q3:为什么OpenAI和Anthropic没有加入Tokenomics Foundation?
A:目前公布的创始支持者名单中,OpenAI和Anthropic均未出现,但官方并未给出具体原因。不过,FinOps Foundation执行总监Storment对此表示乐观,他认为云计算时代各大厂商最初也没有参与FOCUS标准的制定,但在客户需求驱动下最终全都采纳了该标准。他预计AI领域也会出现同样的规律。
好文章,需要你的鼓励
欧洲量子计算初创公司Alice & Bob正式推出其首款完整量子硬件平台——Helium量子系统,标志着该公司从量子芯片制造商升级为完整系统开发商。该系统基于独特的"猫量子比特"架构,仅需18个猫量子比特即可实现首个逻辑量子比特的编码,并集成了处理器架构、控制电子设备及监控软件Starboard。系统功耗仅40千瓦,支持量子与经典计算资源的协同部署,面向高性能计算场景开放研究合作。
本研究发现AI视频生成中物理幻觉的根源是去噪过程中的相位侵蚀,并提出免训练方法PhaseLock,用两步推理的运动先验引导完整生成,物理一致性平均提升6.2分。
Intuit首席AI官Ashok Srivastava对外界盛传的"AI颠覆SaaS"论调保持冷静,认为SaaS行业的演变本是持续循环的一部分。他表示,公司通过引入AI智能体,过去一年开发速度提升40%,五年内开发效率提升12倍。QuickBooks Live订阅量因AI加入翻倍增长,QuickBooks Capital平台同比增长73%。Srivastava同时强调,Intuit拒绝"Token最大化"策略,坚持以服务客户为核心,在合规监管环境下稳步推进AI落地。
本研究测试了5种AI适配方法在11种音乐风格和弦预测上的表现,发现和弦符号确能携带风格信息但不完整,控制词条与完整适配器效果相当。