正如人类无法想象一种“从未见过的事物”一样,人脑理解世界依靠的是类比和逻辑推理,而人类创意的本源是对已知事物的分散拆解和重新组合。当社会发展迈入信息时代,电 子化内容足够丰富之后,通过大模型算法,让计算机如同人脑一般去吸收信息,并进行有逻辑的类比和推演,并最终输出符合人类认知的内容,即形成了近两年极其火热的AIGC (生成式人工智能)。
AIGC的出现让身处各行各业的从业者都感受到了重大的影响和冲击,但首当其冲的,当属以生产虚拟内容为主的互动娱乐行业。以游戏、视频、网文、音 频等为主的互动娱乐行业,不仅在内容的生产方式上受AIGC影响产生了结构性的变化,并且内容本身的呈现形式也将出现巨大变革。本次报告将从AIGC的发展历程、对互动娱乐行业的影响因素、结合AIGC的产品案例、AIGC+互娱行业相关发展趋势等维度,进行综合的梳理与探讨。
本篇报告核心观点摘要
AIGC近年来的快速发展离不开硬件算力的大幅提升。目前AIGC的主要特征包括但不限于:文本生成、图像生成、语音生成、代码生成;视频内容生成(目 前阶段多为视频二创);原生视频生成、3D模型生成;多模态内容的识别与生成等。
AIGC对互动娱乐行业产生了重大的影响和变革。在产品生产环节,利用AIGC能快速批量产出创意的特性,能在工作前期就提供大量的方向和具备一定完成 度的可展示内容,从而实现“降本增效”的核心价值。在内容体验环节,核心价值在于在可控的前提下给用户带来不可预估的超预期体验。
结合了AIGC的典型产品案例分析:《逆水寒》:被誉为国内“首款AIGC+”的游戏产品;《蛋仔派对》:用AIGC突破UGC上限;《妙鸭相机》:简单易 用、效果顶尖、需求明确的C端消费级AIGC应用;《剪映》:从文案编辑、一键成文、视频生成、AI作图到最终剪辑成片的一站式服务。
AIGC虽然下放了互娱行业的内容生产门槛,但受算力和历史累计资产影响巨大,大厂仍拥有引领性的优势;法律风险和版权争议需不断进行调整完善,这 既影响企业使用深度,也影响着消费者的接受度;模型行为的不可预测性可能会反向影响用户体验,例如在游戏中AI一旦“觉醒”就很难恢复“正常”。
本文仅供参考,不代表我们的任何投资建议。【幻影智库】整理分享的资料仅推荐阅读,如需使用请参阅报告原文。
2024年AIGC对互动娱乐行业影响趋势洞察-点点数据.pdf
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。