谷歌正在扩展其Lyria 3音乐制作AI的功能,使其能够创作长达三分钟的音乐作品,并在多个谷歌产品中集成使用。此前,Lyria只能生成30秒的音频片段。Lyria 3 Pro不仅将最大时长增加了六倍,还允许用户针对特定元素进行提示,如前奏、副歌和桥段,从而更好地控制音乐编排。
功能特点与使用方式
Lyria 3 Pro的工作原理与其他流行的音乐生成工具(如Suno和Udio)类似。用户只需描述情绪、风格或乐器配置,系统就能生成相应的音轨。它还可以根据用户的提示生成歌词,甚至可以基于参考照片或视频进行创作。
Lyria 3 Pro的突出特点之一是与其他谷歌产品的深度集成。用户可以直接在Gemini中创建音轨,无需下载专门的应用程序。此外,谷歌还将该模型添加到面向企业客户的Vertex AI、面向开发者的Google AI Studio和Gemini API、面向办公人员的Google Vids,以及最近收购的ProducerAI平台中。扩展的音频时长对ProducerAI用户特别有吸引力,因为该平台是Suno的直接竞争对手。
版权保护与技术安全
能够生成完整歌曲而不仅仅是30秒片段,可能会引发对冒用和版权侵权的担忧。在新闻稿中,谷歌试图缓解这些担忧,表示"Lyria 3和Gemini不会模仿艺术家",并补充说"如果提示中提到某位创作者,模型会将其作为广泛的灵感来源"。谷歌表示,还会检查Lyria 3 Pro的输出内容是否与现有内容重复,以确保AI不会产生侵权材料,并嵌入静默的SynthID水印来识别AI生成的内容。
Q&A
Q1:Lyria 3 Pro相比之前版本有什么重大提升?
A:Lyria 3 Pro将音乐生成时长从30秒大幅提升到3分钟,时长增加了六倍。同时还增加了对特定音乐元素的控制功能,用户可以指定前奏、副歌、桥段等结构,让音乐创作更加精准和完整。
Q2:Lyria 3 Pro如何防止版权侵权问题?
A:谷歌采取了多项措施防范版权问题。首先明确表示模型不会模仿特定艺术家,即使提示中提到创作者也只是作为灵感来源。其次会检查输出内容与现有作品的重复性,最后还会嵌入SynthID水印标识AI生成内容。
Q3:普通用户如何使用Lyria 3 Pro?
A:用户可以直接在Gemini中使用Lyria 3 Pro创建音轨,无需下载专门应用。只需描述想要的音乐情绪、风格或乐器配置,系统就能生成相应音轨。还可以根据照片、视频或文字提示生成歌词和音乐。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。