2024年是大模型席卷全球的第二年,也是在这一年里,大模型价格战打响。
字节跳动在今年5月的发布会上称,豆包主力模型在企业市场的定价只有0.0008元/千Tokens,比行业便宜99.3%。
几天后,阿里在北京召开发布会,并在发布会上表示,阿里云对标GPT-4的商业化模型Qwen-Long的API输入价格降至0.0005元/千tokens,直降97%。
与此同时,百度、腾讯、智谱AI、科大讯飞等一众头部企业纷纷跟进降价策略,大模型价格战就此打响。
为什么大模型价格战会在今年打响,大模型价格战又是否符合商业逻辑?
在今天开幕的第六届北京智源大会上,智源研究院特别邀请到了国内“AGI四小龙”——月之暗面、百川智能、智谱AI、面壁智能的创始人,在现场圆桌讨论环节,一同探讨了相关问题。
杨植麟是月之暗面的创始人,也是最近关注度相当高的一位大模型领域明星创始人,对于企业使用大模型ROI问题和大模型价格战,他有三个观点:
第一,在算力的投入方面,未来某个时间点,模型推理上投入的算力将会超过模型训练上投入的算力,这将标志着大模型的价值开始得到释放,此前用来做模型训练的成本在很大程度上也将被覆盖;
第二,从C端角度来看,模型推理成本将会显著低于获客成本,因而从商业上来讲,现在大模型的商业模式与此前其它行业的商业模式没有不会有本质区别;
第三,今天AI在人的工作流中占比还很低,可能只有1%,未来AI做的事情会在某个时间节点超过人做的事情,这时就可能产生新的商业模式——不再是像今天在B端API调用上打价格战,而可能是一个普惠的AI,最终形成根据大模型产生的价值,从中分成的商业模式。
王小川是百川智能的创始人,他也曾是搜狗公司CEO,是上一个互联网时代的佼佼者,他在智源大会上对这一问题给出的结论是“今天价格战对于中国发展大模型是特别好的事儿。”
他指出,价格战通常是一个竞争导向的市场行为,大模型价格战至少会带来两个好的结果:
第一,大模型价格战让更多公司、更多人可以用上大模型。
很多企业之前不懂大模型,现在他们可以很便宜、甚至免费使用大模型,这时的大模型在中国就能够迅速普及开来,大模型价格战也就变成了一场普及运动。
第二,大模型价格战在一定程度上避免了资源浪费。
在此之前,大家对于大模型不了解的时候会很恐慌,很多企业但凡有点技术能力都会自己训练一个大模型,这就使得本应该是大模型用户的一些企业会自己买卡,甚至会找我们咨询联合训练,都想转型为大模型供给方,这带来了人才、资金和社会资源的浪费。
大模型开始打价格战后,很多企业开始清醒,他们开始知道自己的竞争优势在哪里,也开始清楚地认识到自己没有必要做大模型,开始退回来成为了大模型的用户,这就减少了资源的浪费。
所以,价格战既能带来对社会(使用大模型)的启蒙,也能减少对社会资源的浪费,更多企业也能够在这之中找到自己的定位,市场的分层逐渐出现,大家都能从中受益。
张鹏是智谱AI创始人,是国内另一位关注度颇高的大模型领域创业新星,他在大会上指出:
大模型价格战成为热点后,有人跑来和我们说“你们是价格战的发起者”,我说“这是子虚乌有”。
“其实在之前,我们一直秉持的理念是给用户带来最大的收益价值,用我们的技术,用我们的创新去降低大家使用技术的成本,让技术能够普及,让更多人从中受益。
在很长一段时间里,我们大模型的价格在行业内都是极低的,因为我们的技术确实能做到那一步,能把中间成本的空间释放出来,当做大家的收益,帮助大家把ROI提升到大于1。
大模型价格战从宏观角度来讲,对于中国大模型产业肯定是有利的,有更多人来使用,有更多人真正把大模型当作基础设施。基础设施就是非常便宜,随时都可以用,用户不用在这件事儿上有特别大的投入。
当真有一天AI能力、大模型能力变得像水、电一样成为基础设施时,对于我们来将将会是一个更好的发展态势,这也是我们一直在坚持做的事情。
我们本月20号即将发布的大模型,真的是把成本已经压缩到都不好意思和大家报价的地步。
但是要注意的是,我们不要去过多关注这件事儿,不要过多宣扬这件事儿,这件事儿在商业上肯定是牺牲了企业短期利益,亏本做买卖不是一个正常的商业逻辑,只能持续很短时间,我们还是要真正回归用户价值、生产力价值。”
李大海是面壁智能的创始人,也是一位拥有12年创业经验的连续创业者,而面壁智能更聚焦的是端侧大模型。
就端侧大模型,李大海指出,我们做端侧大模型就是看到了端侧能够更早、更快落地的一个可能性。
最近一家调研机构公布的数据显示,全中国10亿手机用户的端侧算力差不多相当于100万片H100的算力,这是一个非常夸张的数字。如果这些不同手机上的算力能够被很好地用起来,很多应用就已经能够落地了。
不过,无论是现阶段,还是未来,端侧模型和云端模型都需要能够很好地协同起来。端侧的优势是隐私性好、更可靠,但云侧模型能力肯定更强,那么,如何将端侧模型和云端模型能力协同好将会是后续大模型厂商需要协同攻克的问题。
李大海认为,“当前所谓的战多多少少有一些营销的成分在,但是我相信未来的大模型一定会比现在还要便宜,并且大家都有利润,这才是健康的商业模式,也只有这样才能够让大模型在千行百业落地。”
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。