音乐人习惯于每次创作被使用时获得报酬。无论是黑胶/CD销售、流媒体、广播、翻唱版本,还是卡拉OK等各类细分场景,行业内都有明确协议来界定"使用"的含义。其背后的经济逻辑简单直接:作品被使用得越多,创作者赚得越多。
生成式 AI 的出现,让"使用"的定义变得复杂。一方面,有观点认为一段音乐训练数据的"使用"只发生一次,即训练时刻;另一方面,创作者也有理由主张,他们作品的创意精髓已经融入模型结构之中,每次模型生成输出时都在被"使用"。
如今,Sureel、SoundVerse等公司正致力于在AI时代重建激励创作的基本经济逻辑。这些举措旨在推动生成式 AI 行业从"有史以来最大规模版权盗窃行为"的指控中走出,转向与艺术创作者和谐共存的新模式。
华纳音乐集团近期收购的初创公司Sureel已与瑞典版权机构STIM合作,探索当音乐作品被用于训练生成式 AI 工具时,创作者获得报酬的可行路径。Sureel的软件会为在线媒体(如音乐文件)附加版权所有者设定的使用规则,明确AI公司是否可以自由使用该媒体进行训练、限制其在训练集中的影响比例,或者完全禁止使用。软件随后追踪AI公司在训练中如何使用这些媒体,并据此设定授权费用。
与此同时,AI音乐公司SoundVerse的创始人在2025年发布的白皮书中明确反对"一次性版税买断"的做法,主张艺术家应持续参与AI的生命周期。他们认为,每当生成式 AI 系统产生输出时,训练数据中不同内容所起的作用并不相同。如果系统输出了爵士风格的音乐,那么训练集中的爵士乐内容所做的贡献,显然大于民谣内容。因此,可以针对每次输出,对每条训练数据进行差异化奖励。
Sureel联席总裁Benji Rogers表示:"版权归属并不是要复制旧有的经济模式,而是要首次真正量化那些过去只能靠近似估算的贡献。"
然而,影响力归因需要超越简单的相似度比较。Sureel首席执行官Tamay Aykut指出,真正的挑战在于建立因果关系,即训练数据与训练后模型之间的关联性。
即便AI行业实现了这一目标,也可能带来新的问题——有人可能会专门创作旨在最大化训练数据版税的音乐。尽管所有创意市场都会催生新的激励机制(例如流媒体促使歌曲前奏越来越短),但行业并不需要一个容易被钻空子的经济结构,让拼凑模仿的作品抢走本该属于原创艺术家的收益。
推断某首音乐对生成作品的具体影响,即便是定义清晰的问题,也可能需要借助更高阶的信息论原理,或对单个作品的历史地位与实际影响力进行建模分析。Aykut提出,在设计精良的归因系统中,那些风格独特、尚未被主流认可的音乐作品,其内在价值甚至可能高于流行电台的标准曲目。
STIM业务发展负责人Simon Gozzi表示,该机构正在研究如何将Sureel的归因报告作为音乐人与AI公司之间授权协议的依据。生成式 AI 归因策略能否在维系"流行即回报"的经济逻辑的同时,激励音乐创作的多样性与实验精神?当公众普遍担忧生成式 AI 对文化活力的威胁——技术公司坐收渔利、创意从业者技能被替代、创意产业收入萎缩、互联网充斥低质内容——这一理念无疑令人振奋。Rogers说:"版权归属是我们目前少数几个可信的解决工具之一。"
当前有一个窗口期,可以就如何为AI训练数据付费展开讨论,并建立起能够支撑充满活力、可持续发展的创意产业的相关机制。
训练数据归因的技术难题既复杂,又缺乏清晰的定义边界。基于相似度测量的简单归因策略,可能诱使人们反向拆解某一流派的经典作品以套取版税;而基于某种原创性信息论的复杂归因策略,则可能被轻易操控,或无法真正奖励人类的文化创作。
对于创意工作者而言,即便出发点良好,AI版权归因也很可能只会加剧他们早已疲于应付的繁琐、不透明的利益博弈。音乐AI领域内部也存在质疑声。SourceAudio总裁Drew Silverstein表示:"归因看似是显而易见的答案,但在AI领域存在缺陷,我们需要考虑其他模式。"他主张采用简单的协商协议,在训练时约定一个固定价格或每年重新定价的方式。
与此同时,主导生成式 AI 发展进程的版权诉讼正逐渐让位于越来越多的私下协议,例如环球、华纳与主要AI公司之间就版权许可训练达成的合作协议。尽管前景仍不明朗,但这些协议可能对行业规范的形成产生深远影响。
目前正处于一个窗口期,可以就如何为AI训练数据付费、同时维护创意产业活力展开讨论并建立相关机制。成熟的工程解决方案将发挥重要作用,但也需要充分考量这一挑战的文化复杂性,并通过良好的设计确保公平性与透明度。
此外,类似Suno这样的大型生成模型是否真的拥有最初宣扬的那种可信度,仍有待观察。在许多AI创意应用场景中,人们正重新关注更小型的定制模型,这些模型专门针对特定的人类创意表达需求而设计,例如IRCAM的RAVE模型或Jen的Style Filters。与此同时,面向普通用户的创意应用可能正在向粉丝互动方向转型。OpenAI突然搁置Sora,尽管此前正与迪士尼进行谈判;而Suno在与环球达成协议后,近期着力打造直接围绕艺术家作品的粉丝互动体验——这些迹象都表明,创意AI领域正经历成长阵痛。
向更小型、更精准的模型与应用转型,将为创作者联盟提供更大空间。例如,音乐人群体可以联合起来,为小型定制模型提供训练数据,收益分配可以采用平等原则或其他公平标准。
混合模型架构与结构化训练机制或许也有类似潜力——在训练过程的不同阶段使用不同数据源,以及将特定情境信息与训练数据结合以提升效果的检索增强生成(RAG)技术。即使某种方法在技术效果上略逊一筹,但若能实现更公平、更透明的版权归因,并为创作者带来更丰厚的版税收益乃至明确的署名权,反而可能更容易获得创作者的支持与参与。
此外,无论归因算法多么精密,它始终建立在人为决策之上,而这些决策可能明智公正,也可能武断腐败。如果你向音乐行业内部人士询问录音版税与词曲创作版税之间的分成比例是如何确定的,恐怕需要一番长篇大论才能说清。训练数据归因机制能达到的最佳状态,是促进关于创意和文化产业公平性与活力的开放、知情讨论;最坏的情况,则是将本已不透明的私下协议进一步掩藏在复杂的黑箱之中。
这正是国家政策至关重要的原因。Rogers表示,版权归因必须"多层次且可审计,对专家和监管机构保持开放"。制定此类政策需要融合计算机科学、音乐学、法律与经济学等多学科专业知识。具备AI竞争力的政府,可以通过支持相关机构来提升本国文化和创意产业的实力。
即便是最自由市场化的经济体,也会超越纯粹的市场逻辑来维护文化表达,无论是通过公共艺术资助,还是针对广播电台的本土音乐配额等措施。随着生成式 AI 对创意产业的经济影响逐渐显现,征税、再分配以及对文化基础设施的积极扶持,仍可能是推动积极社会效益的最有效途径。对大型AI公司征税并将收益再分配给那些为行业创造财富的创意工作者,归根结底,也是另一种形式的"AI归因策略"。
Q&A
Q1:Sureel的音乐版权归因系统是如何运作的?
A:Sureel的软件会为音乐文件等在线媒体附加版权所有者设定的使用规则,明确AI公司是否可以自由使用、限制使用比例或完全禁止使用。软件随后追踪AI公司在训练过程中实际使用这些媒体的情况,并据此设定授权费用。该系统旨在量化训练数据对AI输出的实际贡献,而不仅仅是进行近似估算。
Q2:SoundVerse提出的音乐人持续参与AI生命周期是什么意思?
A:SoundVerse的创始人反对"一次性版税买断"的做法,主张每当生成式 AI 系统产生输出时,都应根据不同训练数据的贡献程度进行差异化奖励。例如,如果AI生成了爵士风格的音乐,训练集中的爵士乐内容应获得更多报酬,而不是所有训练数据平均分配。这种方式让艺术家能够持续从AI的每次使用中获益。
Q3:训练数据版权归因存在哪些主要风险?
A:主要风险有两点:一是简单的相似度归因策略可能诱使人们专门创作模仿经典作品的音乐来套取版税,损害真正原创作品的利益;二是复杂的归因算法可能被操控,或将本已不透明的私下协议进一步掩藏在技术黑箱中。此外,归因系统始终依赖人为决策,存在武断甚至腐败的风险。
好文章,需要你的鼓励
在基于Chiplet的架构中,可观测性正成为系统设计的关键缺失环节。多位半导体行业专家指出,AI可从硅层遥测数据中挖掘价值,但前提是架构须提供一致的检测手段、近传感器数据压缩及可编程采集能力。专家们强调,多供应商Chiplet生态系统需要标准化、安全的遥测模式,以实现跨芯片、封装和互联域的故障定位,同时保护敏感运营数据。目前,AI在遥测分析阶段已展现出显著价值,但可观测性的扩展本质上仍是架构问题。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
生命科学企业在全渠道战略和AI平台上投入巨大,但成效往往不尽如人意。问题根源不在于技术本身,而在于组织架构、数据治理和工作方式未能同步演进。许多转型项目止步于试点阶段,原因是各部门数据孤立、职责不清。要实现从传统CRM向智能互动的真正转型,企业需优先建立统一的数据基础和跨团队协作机制,并将AI能力嵌入日常工作流程,而非将其视为独立模块。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。