AI音频生成独角兽公司ElevenLabs周二宣布推出一款新模型,允许用户生成音乐,该公司声称这款产品已获得商业使用许可。
这一举措标志着ElevenLabs在成立三年来首次扩展业务范围,此前该公司主要专注于构建AI音频工具。ElevenLabs是文本转语音AI产品领域的领导者,并已扩展到对话机器人和语音翻译工具领域。
随着产品发布,ElevenLabs分享了其AI生成音乐的样本。
其中一个样本展示了合成语音说唱,内容是关于"带着雄心壮志从缝隙中崛起"并离开家乡,从"康普顿到宇宙"的旅程。听到计算机反映Dr. Dre、N.W.A.和Kendrick Lamar等艺术家的影响和语言风格令人不安,因为这些艺术家实际经历了这项技术试图模仿的体验。
鉴于AI音乐生成工具训练材料来源的担忧,初创公司涉足音乐生成并非易事。
去年,Suno和Udio被美国唱片业协会(RIAA)起诉,该协会是美国音乐行业的贸易组织。这些诉讼指控Suno和Udio使用受版权保护的材料训练其音乐生成模型。据报道,这些公司现在正与主要唱片公司讨论授权协议。
ElevenLabs还宣布与独立音乐人数字出版平台Merlin Network和Kobalt Music Group达成协议,使用他们的材料进行AI训练。
根据Merlin网站信息,该公司代理的知名艺术家包括Adele、Nirvana、Mitski、Carly Rae Jepsen和Phoebe Bridgers;Kobalt则代理Beck、Bon Iver和Childish Gambino等明星。
Kobalt代表告诉TechCrunch,艺术家必须自愿选择加入,才能将其音乐授权用于AI。
Kobalt代表向TechCrunch表示:"我们的客户从这项协议中获得了几个关键好处:在不断增长的市场中开辟了新的收入来源,包括收入分成让他们参与收益,提供强有力的侵权和滥用保护措施,并提供与其他出版和录音权利持有者相当的优惠条款。"
Q&A
Q1:ElevenLabs的AI音乐生成器有什么特别之处?
A:ElevenLabs新推出的AI音乐生成器最大特点是声称已获得商业使用许可,这解决了AI音乐生成工具面临的版权争议问题。该公司与Merlin Network和Kobalt Music Group等数字出版平台达成协议,获得合法的训练材料来源。
Q2:为什么AI音乐生成存在版权争议?
A:因为许多AI音乐生成工具使用受版权保护的材料训练模型。去年Suno和Udio就被美国唱片业协会起诉,指控它们未经授权使用版权材料。这使得AI音乐生成公司必须寻求合法的授权途径。
Q3:艺术家如何参与ElevenLabs的AI音乐训练?
A:根据Kobalt代表的说明,艺术家必须自愿选择加入才能将音乐授权给AI使用。艺术家可以从中获得新的收入来源和收入分成,同时享有侵权保护和优惠条款。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。