OpenAI可能正在收缩视频生成业务,但Google却在大力推进其Vids编辑产品的重大AI升级。该公司最新的视频和音频模型现已集成到该工具中,用户可以选择各种可控的智能体出现在生成的视频中。您的作品现在也更容易在YouTube上分享。
Veo 3.1视频生成模型的重大升级
Veo 3.1是Vids升级的最大亮点。Google去年底首先在Gemini中部署了这一更新模型,承诺在真实性和一致性方面有显著改进。虽然Google将Veo定位为电影制作者的工具,但Vids的定位有所不同。Google建议使用Vids中的AI工具来创建动画聚会传单、商业宣传片或视频贺卡。
用户可以免费使用Vids,但如果没有AI订阅,生成的视频数量会受到限制。如果您的账户没有付费AI访问权限,每月只能生成10个视频。AI Pro订阅用户可以获得50个视频,而购买Google昂贵的AI Ultra计划(个人版或企业版)的用户每月可获得1000个视频。与大多数其他Veo实现方式一样,视频长度为8秒,分辨率为720p。
Lyria音乐生成模型增强音频体验
Google最近推出的Lyria音乐创作模型现在也是Vids的一部分。这个AI音乐制作工具的最新版本甚至不需要您输入歌词。您只需告诉机器人您想要什么氛围,它就会创建一个30秒或3分钟的音轨。虽然这不算高艺术,但如果您只是制作动画生日卡片,这可能就足够了。与视频一样,AI订阅用户在AI音乐方面也有更高的限制。
可定制智能体解决一致性问题
一致性始终是生成式系统的一个问题,但Google在Vids中为此提供了解决方案。该工具现在有各种预设的AI智能体,包括写实和卡通风格,您可以将它们添加到视频中。这些角色从一个场景到下一个场景的声音和外观都会保持一致(可选的外观定制),您可以提示智能体说出和做您想要的事情。它们甚至可以与生成视频中的物体进行交互。
便捷的录制和分享功能
Google希望减少摩擦,帮助人们使用Vids,即使他们不使用AI功能。新的Chrome扩展程序让您可以立即录制屏幕或摄像头内容,而无需打开Vids。它具有所有录制工具,可以将您的视频发送到完整的Vids网站进行进一步编辑。
您在Vids中创建的视频,无论是否由AI生成,现在也更容易分享。Vids可以直接在Google的流媒体网站上发布视频,而不是下载后再上传到YouTube。导出的视频默认为私有,允许您根据需要更改分享设置。
所有新功能现在都已在Vids中上线。
Q&A
Q1:Veo 3.1模型有什么特殊功能?
A:Veo 3.1是Google最新的视频生成模型,集成在Vids编辑产品中。它在真实性和一致性方面有显著改进,可以生成8秒长、720p分辨率的视频,适合制作动画聚会传单、商业宣传片或视频贺卡等内容。
Q2:Google Vids的AI智能体有什么作用?
A:Google Vids提供各种预设的AI智能体,包括写实和卡通风格。这些智能体可以解决生成式系统的一致性问题,从一个场景到下一个场景保持相同的声音和外观,用户可以提示它们说话和行动,甚至与视频中的物体互动。
Q3:使用Google Vids需要付费吗?生成限制是什么?
A:Google Vids可以免费使用,但有生成限制。免费用户每月只能生成10个视频,AI Pro订阅用户可获得50个视频,AI Ultra计划用户每月可获得1000个视频。同样的限制规则也适用于Lyria AI音乐生成功能。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。