始于Token,不止于Token 原创

企业AI,是一个源自Token,但又非Token计数器能完全捕捉的庞大世界。

回望2025年,关于AGI技术路径的讨论依然热烈:算力Scaling的“参数竞赛”还是算法的“效率竞赛”?是“训练优先”还是“推理为王”?是预训练还是持续学习?站在技术演进的河流中央,很难判断哪条支流最终会汇入AGI的大海。

不过,有一件事正在形成共识。

微软CEO萨提亚·纳德拉在去年的一次访谈中,提出了一个有启发性的视角:如果你要谈论智能的大爆发,首先要观察的是GDP增长。AGI的里程碑,不能是无意义的benchmark hacking,真正的标尺应该是全球经济增长10%,也就是像工业革命那样的增长。

这把讨论拉回到一个朴素但关键的问题:无论用什么技术路线,AI的终极价值在于它能否成为新一轮工业革命的引擎,真正撬动经济产出。

如果这成为标尺,与经济产出强相关的战场,自然绑定在企业AI。它如何更快更好地落地,也就成了一个比技术路线之争更关键的命题。

但企业AI偏偏是一个很难被"看见"的领域。道理很简单:如果AI真的好用,成了企业的新护城河,大家并不会那么愿意讲自己的具体情况。所以,统计数字告诉你"是什么",却很难告诉你"为什么"和"还有什么"。

还好,社会学中有一种研究方法叫"田野调查"。它起源于人类学,核心主张是:要理解真实世界,只读报告和统计数据是不够的,必须到现场去。因为二手材料会系统性地遗漏那些记录者认为"不重要"的东西,而那些东西往往才是理解事物的关键。

2025年,至顶科技一直对阿里云保持密切关注。这家中国最大的云计算厂商在新一轮的AI浪潮中如何转身和应对?阿里云的客户涵盖从央企到创业公司、从金融到制造的几乎所有行业,这种广度本身就是一份独特的样本。

正所谓“我带上你,你带上肉”,阿里云就成了我们观察中国企业AI落地的一个重要窗口。

那么,通过这一年的观察,我们总结出了一个关键洞察:企业AI,是一个源自Token,但又非Token计数器能完全捕捉的庞大世界。

 

水面下的AI用量

在阐述观点之前,我们不妨先用一点篇幅,归纳总结一下阿里云耕耘其中的典型案例。

先说农业。 中国排名靠前的养猪企业牧原、新希望,在使用多模态模型做猪的数量识别、异常行为识别等工作。他们还基于私域数据训练兽医大模型,解决兽医人力不足的问题。

再说制造业。 机械装备领域的三一重工等企业,其AI工作顾问把几十年生产数据的经验内化成模型,让一个新手也可以借助AI知识库快速变成专家,缩短整个培养周期。船舶制造、重型设备加工领域同样在部署AI故障诊断和工艺标准助手。 

制造业中的汽车行业更是观察AI不可或缺的拼图。据统计,中国车企智能化落地有100%阿里云参与提供支撑。其中理想汽车的"理想同学"MindGPT大模型已搭载超50万辆车,日均处理交互请求1.2亿次,任务执行准确率达98.7%。东方航空打造了国内航司首个行程规划Agent,基于通义千问的语义理解和复杂任务规划能力服务全球旅客。智能驾驶和具身智能领域已普遍选择通义开源作为基座模型。

然后是金融。 工商银行构建了"工银智涌"大模型技术体系,用通义灵码月均生产并被采纳代码超过140万行;建设银行金融科技子公司建信金科引入通义灵码赋能研发全流程,代码智能生成采纳率超30%。工行还基于通义千问多模态大模型推出"商户智能审核助手",在商户准入审核环节用多模态技术取代传统OCR。阿里云服务着中国全部政策性银行及100%的国股行。这些真实的生产力产出,都是基于开源模型做后训练,和银行几十年积累的数据、流程、合规要求深度绑定的产物。

看完这些案例,大家可能就会发现。从第一产业到第三产业,从传统行业到新质生产力,这些客户会在云上训练、推理模型,但却将很大一部分AI负载抽离简单的MaaS API调用,放在企业微调、部署的自家模型环境里。

这一趋势,也可以在千问系列开源模型的表现得到印证,截至目前,其全球下载量超过7亿次,衍生模型突破18万个。其中很多,都是支持了企业的内部AI运转的。

因此,如果把公共云租赁GPU部署、企业私有部署、端侧运行、开源模型本地调用这些"看不见"的使用量都算进来,真实的AI使用规模可能是公开统计口径的数倍乃至更多。

或许,我们可以得出第一个观察:Token的来源其实有两种。在企业AI这个场景中,有水面上的云端大模型调用,也有水面下的部分——企业本地环境中的模型部署和调用

只看一种Token计数,恐怕未必能呈现市场全貌。

而第二个观察,则是Token在不同场景上的价值差异。

因为同样是消耗1000个Token,场景不同,价值是天差地别的。

在APP里写个笑话是1000个Token,在维修助手里诊断一台设备故障也是1000个Token,在监控系统里识别一个关键异常还是1000个Token。但此Token非彼Token,后两者Token所创造的社会价值和经济价值无疑更大。

这倒是也让我们想起一个著名的工程师轶事,发生在上一次工业革命周期,具体情形已经不可考,但是大致剧情如下:

20世纪初,福特(Henry Ford)在密歇根州迪尔伯恩的River Rouge(鲁日河)工厂遇到麻烦:一台巨型发电设备停摆,厂内电气工程团队折腾多日找不到症结。于是,福特请来了GE的顶级电气工程师查尔斯·普罗透斯·斯坦门茨。

斯坦门茨到场后没有大拆大改,只是独自测量、听诊、计算了两天,然后爬上设备在机身侧面画了一道粉笔记号,让工程师按标记位置打开面板、处理线圈绕组,设备随即恢复正常。几天后,福特收到GE寄来的账单:1万美元。福特于是要求列明细,斯坦门茨回了两行:画粉笔记号 1 美元;知道该把记号画在哪里 9999 美元

有些Token消耗就像那道粉笔线,数目很小,本身不值钱,但背后解决问题的价值则力有千钧。

既然说到解决问题的能力,这就延伸到现在AI产业在不断讨论的商业模式问题。

早期软件时代是卖授权,SaaS时代卖订阅。既然Token的价值因场景而异,那么AI时代是否可能产生新的商业模式"按结果付费",也就是Result as a Service(RaaS)?

从阿里云的观察来看,这个趋势是存在的,只不过今天模型还在快速迭代,衡量效果的手段还有待完善。

既然客户需求在变,那么技术供给方的方案也要跟着变,此之谓以客户为中心。

 

四条AI路径,一座AI超级工厂

从2025年4月的AI峰会到9月的云栖大会,阿里云反复讲述了一个"AI超级工厂"的模式。

对于AI使用,AI超级工厂至少提供四种模式:

第一种, 自己训练大模型。智驾公司就是典型,它们需要用自己的数据训练专属模型,这是最"重"的方式。

第二种, 开源模型做定制。银行和制造业常用这种方式,他们拿千问这样的开源模型,结合自己的业务数据做后训练,变成专属模型应用。

第三种, 灵活调用模型推理服务。一些企业还不需要训练自己的模型,但需要比通用API更高的性能保障,所以使用专属的推理资源。

第四种, 一站式快速构建Agent等AI应用。这最接近一般意义上的"按Token付费"模式,通常是轻量级场景。

很有意思的是,这四种方式并非井水不犯河水。截止到现在,在阿里云上调用MaaS API的客户和使用GPU部署模型的客户 ,重合度约为70%。

这说明中国第一批深度拥抱AI的客户,非常清楚什么场景该用什么方式。他们会把场景分档:轻量级的调API,需要和业务深度结合的做后训练,涉及核心能力的自己训模型。同一家企业,可能同时使用三四种方式。

还有一个内部发现是:那些深度使用AI的客户,他们在计算、存储、网络、大数据等基础云资源上的增长,远高于阿里云整体客户的平均增长率。"AI Infra就是云,或者说,云已经变成了AI Infra。"

不过,回头看深度使用AI的企业,往往有一个共同特征:都是各自行业的头部企业。所以,为什么是它们先用起来?除了预算相对富足之外,是否还有其他原因?

 

AI上限:外靠模型,内靠数据

一个重要原因是:数据。

无论是训练自己的模型,还是构建企业级的AI应用,数据质量都是硬门槛。

让我们用当下最热的Agent举例,一个能自主完成任务的AI业务助手。

假设你用Agent完成"查一下上个月华东区的销售数据,生成一份分析报告",它需要自己调用数据库、分析数据、生成文档。比起简单的问答,Agent必须能理解企业的业务逻辑,访问企业的内部数据,才能执行一系列操作。

所以,Agent的能力上限取决于两个因素:一方面取决于模型能力(这可以由千问等外部模型供给),另一方面自然取决于数据质量(也需要由内部自发完成)。

模型能力好理解:模型越强,Agent能完成的任务越复杂。但数据质量这个因素经常被忽略。

理想状态下,Agent拿的数据应该是新鲜的、高质量的、清洗过的、实时动态的,而不能是一塌糊涂的数据。

什么叫"一塌糊涂的数据"?一个看空间维度,另一个看时间维度。

空间维度:比如,同一个客户在CRM系统里叫"张三",在财务系统里叫"大客户张",在物流系统里叫"张先生",这三条记录其实是同一个人,但系统不知道就麻烦了。

时间维度:再比如,销售数据每周更新一次,但市场活动数据实时更新,两边对不上。这些问题听起来琐碎,但如果不解决,Agent就会给出错误的答案。

这就是"数据治理":把散落在各个系统里的数据统一标准、清洗整合、实时同步。这不是买一套软件就能解决的问题,而是需要多年持续投入的基础工程。

所以,一个冷峻的现实:一家企业能构建多强的Agent,首先取决于它过去数年的数据治理做得怎么样。

去年年中,我拜访一汽集团的时候,中国一汽红旗品牌运营委员会副总裁兼体系数字化部总经理门欣就表达了类似的观点:在"大模型"这个词汇变得性感之前的三、四年,一汽就开始了一项看似枯燥、后来看实则关乎生死的系统性工程——数据治理。

如果说大模型是Agent的大脑,数据是Agent的脊梁。没有强大的数据能力,Agent也是无源之水。

这也解释了为什么AI在企业的落地才刚刚开始。不是技术不够,不是意愿不足,而是数据治理本身就是一个长周期工程。头部企业能深度用AI,是因为它们早期就投入了。

AI变革,已经是所有企业一号位的必修课。所以,就像模型经过Scaling Law的洗礼才变得强大,数据工作也在提速过程当中。

企业AI市场,也就无比广阔。

有一个相似的故事:1996年,一家国际手机巨头的总裁到访中国,预测到2000年中国手机用户大概有100万。实际上到2000年已经突破1亿,再过几年又突破10亿。当时没人能想象市场的真实规模。

今天的AI市场也是如此。据IDC的报告,把所有中国云厂商的AI收入加在一起,单看MaaS服务,在整个公有云市场中的占比也就1%左右。

所以,我们或许可以用一个词语来总结:什么才是真正的完整的AI? 

大AI无疆

记得和刘伟光的一次交流中,他用四个字总结了对AI的理解,叫“AI无疆”。确实如此,疆为边界。但AI的行业延伸没有边界,从金融到农业,从制造到物流。用户的使用方式也没有边界,云端、本地、端侧是并存的。价值创造更没有边界,AI投入不再是IT预算的一个新科目,甚至全部IT预算也无法覆盖AI的全部,更准确的描述该是生产力提升的对价。

自然,丈量这一切的尺子,也不应该只有一把。就像斯坦门茨的那道粉笔线,真正的价值不仅在于"划线动作"本身能被计数多少次。

回到开篇纳德拉的标尺:AI的终极价值在于撬动经济产出。从阿里云的布局来看,他们接下来的目标是拿下AI市场增量的80%,相当有进取心的数字。不过,有一点是确定的,相对于存量,增量才是决定性的。随着AI的广度、深度渗透,其中增量的10%,可能就已经超过今天100%的存量了。

来源:至顶网人工智能频道

0赞

好文章,需要你的鼓励

2026

01/12

10:30

分享

点赞