语音AI公司ElevenLabs推出了其音乐生成模型的全新版本Music v2,该模型能够在一首歌曲中途实现风格切换。公司表示,这一模型专为处理人声和作曲的复杂性而设计。距离该初创公司发布首个版本的音乐生成模型,这次新版本的推出已过去近10个月。
ElevenLabs指出,该模型可以从歌剧无缝切换到重金属再切换回来,能够呈现快速说唱而不失连贯性,还可以在曲目中添加非音乐类音效。借助新模型,艺术家可以选择歌曲的某个部分,通过提示词重新创作该部分,而不影响曲目的其他部分。
此外,艺术家不再局限于生成短片段,而是可以按段落构建歌曲,包括前奏、主歌和副歌,然后将它们拼接在一起。ElevenLabs补充说,该模型在跨语言、歌词、人声和编曲方面的表现更加稳定可靠。
近几个月来,AI实验室一直在竞相发布能够生成专业级音乐的模型。谷歌、Stability AI和Suno也都发布了新的音乐生成模型,具备生成更长、更复杂曲目的能力。在谷歌I/O开发者大会上,谷歌为其Flow Music工具增加了轻松创建翻唱、按段落编辑歌曲以及生成音乐视频的功能。
ElevenLabs强调,新模型基于授权数据构建,并已获得商业使用许可,因此用户可以自由使用生成的曲目。与唱片公司达成协议至关重要,因为其他AI音乐初创公司,如Suno和Udio,都曾因版权问题面临诉讼。
新模型已在ElevenLabs面向营销和品牌团队的ElevenCreative工具上线,同时也在其新推出的用于创作AI生成歌曲的ElevenMusic平台上提供,不久后还将在ElevenAPI上推出。
Q&A
Q1:ElevenLabs的Music v2模型有什么特别功能?
A:Music v2模型可以在一首歌曲中途实现风格切换,比如从歌剧切换到重金属再切换回来。它还能呈现快速说唱而不失连贯性,添加非音乐类音效,并允许艺术家选择歌曲的某个部分进行重新创作而不影响其他部分。此外,艺术家可以按段落构建歌曲,包括前奏、主歌和副歌,然后拼接在一起。
Q2:Music v2模型和其他AI音乐生成工具相比有什么优势?
A:ElevenLabs强调Music v2模型基于授权数据构建,并已获得商业使用许可,用户可以自由使用生成的曲目,不会面临版权问题。这与Suno和Udio等其他AI音乐初创公司因版权问题面临诉讼的情况形成对比,为用户提供了更安全的商业使用保障。
Q3:在哪里可以使用ElevenLabs的Music v2模型?
A:新模型目前已在ElevenLabs面向营销和品牌团队的ElevenCreative工具上线,同时也在其新推出的用于创作AI生成歌曲的ElevenMusic平台上提供。不久后还将在ElevenAPI上推出,为开发者提供更多集成选项。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。