Stability AI发布可生成六分钟音乐的新音频模型

Stability AI推出Stable Audio 3.0系列音频模型,包括四个版本。最大版本可生成超过六分钟的专业级音乐,保持音乐结构和旋律完整性。公司开放三个小型模型的权重供免费使用,大型模型仅通过API提供。新模型基于完全授权的数据训练,公司已与华纳音乐和环球音乐达成合作协议,并计划为专业音乐人开发新产品套件。

Stability AI是Stable Diffusion背后的公司,该公司近日发布了名为Stability Audio 3.0的新音频模型系列。据该公司称,其顶级模型能够生成超过六分钟的专业级音乐。

Stability Audio 3.0系列包含四个新模型

该公司在Stable Audio 3.0名称下发布了四个新模型:小型音效模型(4.59亿参数)、小型模型(4.59亿参数)、中型模型(14亿参数)和大型模型(27亿参数)。两个小型模型适合在设备端生成最长两分钟的音效和音乐。

中型和大型模型都能创作长达6分20秒的完整作品,并能保持音乐结构和旋律基调。这是2024年发布的Stable Audio 2.0生成能力的两倍多。

开放权重与商业授权并行

Stability AI正在以开放权重的形式提供小型音效、小型和中型模型,供任何人使用和修改。2024年,该公司发布了Stable Audio Open,可生成最长47秒的音乐。新模型系列相比之前的开放版本有了巨大飞跃。

大型模型仅通过API和付费自托管服务提供。此外,年收入超过100万美元的公司需要获得企业许可证。

音乐生成领域的竞争与版权挑战

包括谷歌和ElevenLabs在内的许多公司都在发布音乐生成相关的模型和工具。然而,正如Suno和Udio正在进行的法律诉讼所证明的那样,数据授权和与音乐厂牌的合作可能成为这些服务长期生存的关键部分。

去年,Stability AI与华纳音乐集团和环球音乐集团签署了协议,共同开发模型和音乐创作工具。该公司表示,其最新的音频模型系列是基于完全授权的数据构建的。

面向专业音乐人的新产品线

这家AI初创公司正在为专业音乐人开发一套新产品,但没有透露更多功能细节。环球音频和Fender前首席数字官Ethan Kaplan将加入该公司,领导Stability的专业音乐业务。

许多AI公司正试图通过聘请音乐行业高管来增强其可信度。今年早些时候,Suno聘请了前Merlin首席执行官Jeremy Sirota担任首席商务官。ElevenLabs也从独立音乐出版商Kobalt聘请了Derek Cournoyer,担任其音乐业务的战略负责人。

Q&A

Q1:Stability Audio 3.0能生成多长的音乐?

A:Stability Audio 3.0的中型和大型模型能够创作长达6分20秒的完整音乐作品,并能保持音乐结构和旋律基调。这是2024年发布的Stable Audio 2.0生成能力的两倍多,相比之前的开放版本有了巨大提升。

Q2:Stability Audio 3.0有哪些模型可以免费使用?

A:Stability AI以开放权重的形式提供小型音效模型、小型模型和中型模型,供任何人免费使用和修改。大型模型仅通过API和付费自托管服务提供,年收入超过100万美元的公司需要获得企业许可证。

Q3:Stability AI如何解决音乐生成的版权问题?

A:Stability AI与华纳音乐集团和环球音乐集团签署了合作协议,共同开发模型和音乐创作工具。该公司表示,其最新的音频模型系列是基于完全授权的数据构建的,以避免像Suno和Udio那样面临版权诉讼。

来源:Techcrunch

0赞

好文章,需要你的鼓励

2026

05/21

17:03

分享

点赞

邮件订阅