自 2023 年以来,全球对 AIGC 产业的关注越来越广泛。随着 AI2.0 时代的到来,AIGC 不仅仅是将 AI 能力融入到现有应用中那么简单,更是迎来了未来产业范式的再塑造。AI 正在跳跃式地加速渗透到各行 各业,并推动了一场新的生产力和创造力革命。随着 AIGC 产业的发展,AI 产业链各环节参与者的角色、 功能和产品服务将不断调整。未来 AIGC 产业的前景也会更加广阔。
在本文中,我们将以 AIGC 为主题,分析目前行业发展的情况,梳理相关驱动政策,探究 AIGC 产业的 商业模式。接下来,我们将对 AIGC 的产业链进行梳理,针对重点可关注环节进行详细讲解,介绍相关 公司。最后,根据以上内容分析行业未来发展趋势。
AIGC(AI-Generated Content)本质上是一种内容生产方式,即人工智能自动生产内容,是基于深度学 习技术,输入数据后由人工智能通过寻找规律并适当泛化从而生成内容的一种方式。过往的内容创作生 态主要经历了 PGC、UGC 到 AIUGC 的几个阶段,但始终难以平衡创作效率、创作成本及内容质量三者 之间的关系,而 AIGC 可以实现专业创作者和个体自由地发挥创意,降低内容生产的门槛,带来大量内 容供给。

中国 AIGC 产业市场规模
根据第 50 次《中国互联网络发展状况统计报告》,截至 2022 年 6 月,中国互联网普及率已高达 74.4%。在网民规模持续提升、网络接入环境日益多元、企业数字化进程不断加速的宏观环境下,AIGC 技术作为新型内容生产方式,有望渗透人类生产生活,为千行百业带来颠覆变革,开辟人类生产交互新 纪元。艾瑞咨询预测,2023 年中国 AIGC 产业规模约为 143 亿元,随后进入大模型生态培育期,持续 打造与完善底层算力基建、大模型商店平台等新型基础设施,以此孕育成熟技术与产品形态的对外输出。 2028 年,中国 AIGC 产业规模预计将达到 7202 亿元,中国 AIGC 产业生态日益稳固,完成重点领域、 关键场景的技术价值兑现,逐步建立完善模型即服务产业生态,2030 年中国 AIGC 产业规模有望突破 万亿元,达到 11441 亿元。

多模态已成趋势
按模态划分,大模型可分为自然语言处理(NLP)大模型,视觉(CV)大模型、多模态大模型等。按 应用场景划分,大模型可分为通用大模型和行业大模型。通用大模型是指可在不进行微调或少量微调的 情况下完成多场景任务的大模型,具有强大的泛化能力,ChatGPT、华为盘古大模型以及最新发布的 Gemini 都是通用大模型。行业大模型则利用行业知识对大模型进行微调,以满足在金融、汽车、传媒 等不同领域的需求,如金融领域的 BloombergGPT、汽车领域的毫末 DriveGPT、法律领域的 LawGPT_zh 等。

预训练大模型按照模态可以分为文本、图像、视频、代码、音乐生成等多种,但从底层架构上都分属两 类。Transformer 是一种编解码模型框架,适用于处理文本、代码这类强连续性生成任务;Diffusion、 GAN、NeRF 等框架善于处理图像生成类任务。叠加文-图转换技术可以形成文生图模型。由单模态模型 在实际训练时融合其他模态技术,可形成多模态、跨模态大模型,如 GPT-4、文心一言、Midjourney 等,由于多模态模型可接受文本、图像等不同输入输出形式,对应用场景能够更广泛适配,着力发展多 模态模型成为产研两界共同趋势。

产业链分析
AIGC 产业可分为三层,其中模型层和应用层值得关注。AIGC 现有产业链由数据供给、模型开发与定 制、应用与分发构成。目前来看,模型层为关键因素之一;其次,应用层发展空间巨大。上游数据供给 由收集大量原始数据对其进行预处理,以便提供给模型训练,投资确定性强。在中游,使用注释数据开 发和训练 AI 模型以生成内容,在垂直细分领域进行二次开发,来适应定制化需求;下游协助用户使用 模型和算法生成内容,例如:文本、图像、视频等。基于不同的价值创造逻辑,将生成的内容分发到各 种渠道。









好文章,需要你的鼓励
这份由MIT NANDA项目团队完成的研究报告揭示了企业AI应用的真实现状。报告基于对52家企业的深度访谈、300多个公开AI项目的分析以及153位高管的问卷反馈,发现尽管企业在生成式AI上投入了300-400亿美元,但95%的组织没有看到任何投资回报。只有5%的企业成功跨越了"GenAI鸿沟",创造了实际价值。
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。