上个月,我们推出了Lyria 3,具备定制音乐生成功能,旨在激发创意表达。现在,我们将最先进的音乐生成模型引入更多谷歌产品,并推出Lyria 3 Pro。这一升级版本可创作长达3分钟的音轨,具备更强的定制性和创意控制能力。Lyria 3 Pro能更好地理解音乐创作结构,您现在可以通过提示词指定具体音乐元素,如开头、主歌、副歌和桥段等。它非常适合尝试不同风格或生成具有复杂转换的歌曲。
扩展音乐生成应用场景
高质量的音乐生成应该在创意发生的任何地方都能轻松获得。无论您是应用开发者、企业或音乐专业人士,还是普通创作者,这些集成功能都能让您利用Lyria先进的音乐感知能力来扩展您的创作规模。
Vertex AI:Lyria 3 Pro现已在Vertex AI平台开放公测,面向需要大规模按需音频的企业用户。它为组织提供高保真度创作的扩展能力,从快速生成游戏定制原声带到整合进创意工具、音乐和视频平台。
Google AI Studio和Gemini API:对于构建下一代创意工具的开发者,Lyria 3提供了改进的音乐感知和结构连贯性,带来更大的创意灵活性。Lyria 3 Pro现已与Lyria RealTime一同在AI Studio上线。
Google Vids:Vids是一款任何人都能使用的AI驱动视频创作应用。通过在Vids中集成Lyria 3和Lyria 3 Pro,您可以添加与风格匹配的定制音乐,适用从创意项目到营销视频的各种场景。该功能本周开始向Google Workspace客户和Google AI Pro及Ultra订阅用户推出。
Gemini应用:Lyria 3 Pro的更长音乐生成功能现已在Gemini应用中上线,首先面向付费订阅用户。Lyria 3 Pro增强的定制功能为实验和创作更长音轨提供了更大空间。现在,您可以添加更多细节来完整呈现您的创意愿景,或为视频博客、播客或教程视频创作个性化音轨。
ProducerAI:我们最近推出了ProducerAI,这是一个协作音乐创作工具,由寻求增强创作流程新方式的音乐人打造。通过Lyria 3 Pro,ProducerAI提供智能体体验,旨在帮助各个级别的艺术家、制作人和词曲作者迭代完整歌曲。该服务面向全球免费和付费订阅用户开放。
与创作者合作
我们一直负责任地开发音乐生成工具,与行业密切合作,确保AI成为创意表达的工具。
通过音乐AI沙盒,我们为音乐人、制作人和词曲作者提供一套实验性工具,旨在拓展他们的创意视野。这种合作的洞察帮助塑造了Lyria 3的发展。
我们邀请艺术家将AI整合到他们的工作流程中,确保我们的技术能真正帮助使用者。格莱美获奖制作人Yung Spielburg在Google DeepMind短片《Dear Upstairs Neighbors》的作曲和制作过程中使用了Lyria。我们还与DJ兼制作人Francois K合作,他在迭代过程中使用Lyria创作了一首即将发布的歌曲。
责任性是我们的基础原则,并在Lyria 3的设计和训练中保持核心地位,我们使用的材料都是YouTube和谷歌根据服务条款、合作协议和适用法律有权使用的内容。为保护原创表达,Lyria 3和Gemini不会模仿艺术家;如果提示词中提及创作者姓名,模型仅将其作为广泛灵感来源。此外,我们采用过滤器检查输出内容与现有内容的重复性,用户必须遵守服务条款和生成式AI禁用政策,禁止侵犯他人知识产权和隐私权。所有Lyria 3和Lyria 3 Pro输出都嵌入了SynthID,这是我们识别谷歌AI生成内容的隐形水印。
Lyria 3 Pro正在向专业人士、开发者、组织和普通创作者推出,帮助制作高质量的音乐生成内容。
Q&A
Q1:Lyria 3 Pro相比普通版本有什么优势?
A:Lyria 3 Pro是Lyria 3的升级版本,可以创作长达3分钟的音轨,具备更强的定制性和创意控制能力。它能更好地理解音乐创作结构,用户可以通过提示词指定具体音乐元素,如开头、主歌、副歌和桥段等,非常适合尝试不同风格或生成具有复杂转换的歌曲。
Q2:Lyria 3 Pro在哪些谷歌产品中可以使用?
A:Lyria 3 Pro已经集成到多个谷歌产品中,包括Vertex AI(面向企业用户)、Google AI Studio和Gemini API(面向开发者)、Google Vids(AI视频创作应用)、Gemini应用(面向付费订阅用户)以及ProducerAI(协作音乐创作工具)。
Q3:如何确保Lyria 3 Pro的版权合规性?
A:谷歌采用了多重保护措施:使用的训练材料都是根据服务条款、合作协议和适用法律有权使用的内容;不会模仿具体艺术家;采用过滤器检查输出内容重复性;用户必须遵守相关政策禁止侵权;所有输出都嵌入SynthID隐形水印用于识别AI生成内容。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。