仅在推出商业服务八个月后,AI模型排行榜平台Arena便实现了年化运营收入1亿美元的里程碑。Arena最初是加州大学伯克利分校于2023年启动的一个研究项目,如今已成长为一家估值17亿美元的商业公司。
Arena以其广受欢迎的众包AI模型性能排行榜闻名业界。该排行榜基于逾1000万次用户评测生成。在其面向公众的网站上,用户可以输入一段提示词,系统会同时将其发送给两个模型,随后由用户判断哪个模型的回答更优。
尽管Arena的AI模型排行榜对公众免费开放,但公司自去年9月起开始推出商业服务——"AI评测"(AI Evaluations)。该服务面向模型实验室和企业客户,基于社区数据提供深度的模型性能分析报告,由此开启了Arena的商业化进程。
Arena的营收增长势头印证了其商业产品的市场吸引力,与其活跃的评测者社区同样受到欢迎。这些评测者通常因能抢先体验最新、甚至尚未正式发布的AI模型而聚集于此。
"很多人根本不知道我们已经在盈利了,大家还是把我们当成一个开源项目来看。"Arena联合创始人兼CEO Anastasios Angelopoulos在接受TechCrunch采访时表示。
值得注意的是,Arena所提及的"ARR"与传统意义上的"年化经常性收入"有所不同。Angelopoulos解释称,公司采用的是"按使用量计费"模式,因此收入并非周期性的经常性收入。
在竞争格局方面,Arena目前并无直接对手——另一家众包AI模型评选初创公司Yupp已于今年3月关闭。不过,Angelopoulos表示,Arena在争夺同一类客户预算时,与Mercor、Surge、Scale AI等人工标注初创公司存在竞争关系,这些公司同样在后训练阶段协助模型开发商优化AI产品。
随着AI服务商对模型性能的要求不断提升,对后训练优化服务的需求持续攀升。今年1月,Arena宣布完成1.5亿美元A轮融资,融资后估值达17亿美元,彼时其年化营收为3000万美元。相比之下,此次披露的1亿美元年化营收,意味着Arena在短短数月内实现了超过三倍的增长。
同期,据The Information报道,Handshake来自AI训练业务的年化总营收自1月以来几近翻倍,从5.5亿美元攀升至近10亿美元;Mercor的年化营收也于今年早些时候突破10亿美元,而去年9月这一数字仅为5亿美元。
在产品功能层面,Arena覆盖文本、代码、视觉及图像生成等多类任务的模型评测,并通过近期推出的智能体模式(Agent Mode),进一步延伸至复杂的长流程任务评估。
Arena由Angelopoulos与同为加州大学伯克利分校博士后研究员的Wei-Lin Chiang联合创立,后者现任公司CTO。知名教授、Databricks联合创始人Ion Stoica也是联合创始人之一,他曾在项目初期担任顾问,并于2025年4月公司正式注册时加入。Arena迄今已累计融资2.5亿美元,投资方包括Felicis、Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners、Laude Ventures及UC Investments等知名机构。
Q&A
Q1:Arena排行榜是怎么运作的?评测结果可信吗?
A:Arena的排行榜采用众包方式生成,用户在网站上输入提示词后,系统同时将其发送给两个AI模型,由用户选出表现更好的那个。目前平台已积累超过1000万次用户评测,数据量较大,具有一定的参考价值。此外,用户还可以在排行榜上抢先体验尚未正式发布的最新AI模型,这也是吸引大量评测者参与的重要原因之一。
Q2:Arena的商业模式是什么?靠什么赚钱?
A:Arena的公开排行榜对用户免费开放,商业收入主要来自其于2024年9月推出的"AI评测"服务。该服务面向模型实验室和企业客户,基于社区评测数据提供深度的模型性能分析报告,采用按使用量计费的模式,而非传统的订阅制经常性收入。
Q3:Arena主要竞争对手有哪些?
A:Arena目前没有直接的同类竞争对手,此前唯一类似的众包AI模型评选平台Yupp已于2025年3月关闭。不过,Arena在争夺客户预算方面与人工标注类公司存在间接竞争,主要对手包括Mercor、Surge和Scale AI,这些公司同样为AI模型开发商提供后训练阶段的优化服务。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。