据应用情报服务商Appfigures发布的最新报告显示,图像模型的发布正在成为AI移动应用增长的核心驱动力,其带来的下载量是传统模型更新的6.5倍。
这标志着行业趋势的明显转变。早期推动用户需求增长的,主要是为对话体验提供支撑的新模型发布,以及语音聊天界面等功能更新。而如今,图像能力的跃升正在重塑用户的下载动机。
以ChatGPT和Gemini为例,两款应用在各自图像模型上线后,新增下载量均达到数千万级别。
以谷歌的Gemini为例,其图像模型Nano Banana的发布,在Gemini 2.5 Flash图像模型推出后的28天内带来了超过2200万次额外下载,该应用在此期间的下载量增幅超过4倍。
与此同时,ChatGPT在去年3月推出GPT-4o图像模型后的28天内,新增安装量超过1200万次。Appfigures指出,这一数字大约是GPT-4o、GPT-4.5以及GPT-5等模型发布时所带来下载量的4.5倍。
其他模型的发布也呈现出类似趋势,但规模相对较小。Meta AI于2025年9月推出AI视频动态功能Vibes后,在随后28天内估计带来了约260万次额外下载。(从严格意义上说,这属于视频模型,但其本质仍聚焦于视觉内容,而非纯文本交互。)
不过,报告也提出了警示:下载量的增长并不必然带来移动端收入的同步提升。
图像模型的发布能够吸引用户安装应用、体验升级后的图像生成功能,但这并不意味着用户会因此转化为付费订阅者。以Nano Banana为例,尽管其带来的下载量峰值超过了ChatGPT的4o图像模型发布,但在发布后28天内,估计带动的消费者实际消费总额仅约为18.1万美元。
Meta AI的Vibes功能上线后同样带动了下载量增长,但并未产生实质性收入。
在上述三款应用中,只有ChatGPT成功将关注度转化为实际营收。
Appfigures数据显示,OpenAI的4o图像生成模型在发布后28天内,与此前基准线相比,估计带动消费者实际消费总额约达7000万美元。
DeepSeek的情况也被纳入分析,但其表现与上述规律并不吻合。
DeepSeek R1在2025年1月发布后带来了2800万次下载,但这并非一次典型的模型对比事件。这是DeepSeek的一次破圈时刻——它以远低于竞争对手的训练成本开发出AI模型,凭借这一独特优势从鲜为人知迅速成为行业焦点。这一案例表明,好奇心同样能驱动下载量爆发,尽管此次热潮与图像模型本身并无关联。
Q&A
Q1:为什么图像模型发布比聊天机器人更新更能带动应用下载?
A:根据Appfigures的报告,图像模型发布带来的下载量是传统模型更新的6.5倍。图像生成功能更直观、更具视觉冲击力,容易激发用户的尝鲜欲望。相比之下,聊天模型的升级通常较为隐性,用户感知度较低,因此对下载行为的拉动效果更弱。
Q2:ChatGPT的4o图像模型发布后带来了多少收入?
A:根据Appfigures的数据,OpenAI的GPT-4o图像生成模型在发布后28天内,与此前基准线相比,估计带动消费者实际消费总额约达7000万美元。这是本次报告中唯一一个成功将下载量显著转化为实际营收的案例,Meta AI的Vibes和谷歌的Nano Banana均未实现可观的收入增长。
Q3:DeepSeek R1的下载量爆发是否也是图像模型驱动的?
A:并非如此。DeepSeek R1虽然在2025年1月发布后带来了约2800万次下载,但其爆发原因与图像模型无关。这次增长源于外界对其以极低成本训练AI模型这一技术路径的高度关注,属于一次由好奇心和行业震动驱动的特殊现象,与本报告所分析的图像模型驱动增长的规律不在同一范畴。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。