Google Veo支持竖屏图片转垂直AI视频功能
生成的视频现在与基础图片保持更高一致性,包括竖屏方向的图片。
谷歌正在让其Veo 3.1 AI视频模型更加专注于用户希望生成视频所基于的参考图片。公司发布了去年推出的"素材转视频"工具的新视觉改进,同时扩展了原生垂直视频支持和分辨率升级功能。
素材转视频工具改进
素材转视频工具允许Veo用户基于最多三张参考图片生成视频,提取角色主体、背景和纹理等材料,从而对结果外观实现更多控制。谷歌表示,此次更新将使视频"更具表现力和创造力",并提供"更丰富的对话和叙事"。还有一致性改进应该更加明显——Veo 3.1现在应该确保角色在不同片段和环境中看起来相同,并允许用户在场景间重复使用物体、背景和纹理。
垂直视频支持扩展
使用素材转视频生成的片段现在还支持垂直输出。这是继谷歌去年为开发者提供在没有参考情况下通过文本提示生成垂直视频的能力之后的进一步扩展。用户可以选择以原生9:16宽高比输出视频,可直接上传到TikTok和YouTube Shorts等平台,而无需在视频编辑软件中手动裁剪结果。
平台集成更新
谷歌从今天开始将Veo改进的素材转视频和竖屏模式功能添加到Gemini应用中,并"首次"将这些工具集成到YouTube Shorts和YouTube Create应用中。
4K分辨率升级
最后,此次更新允许Veo 3.1用户将生成的视频升级到4K分辨率,从之前的1080p限制提升。谷歌表示,1080p视频生成也得到改进,提供"更清晰、更干净的视频"。这并不是谷歌在2024年声称Veo能够生成的原生4K分辨率——这是我们在任何向公众发布的Veo版本中都尚未看到的功能——但平台内升级总比没有要好。
Q&A
Q1:Veo 3.1的素材转视频工具有什么新功能?
A:素材转视频工具允许用户基于最多三张参考图片生成视频,可以提取角色、背景和纹理等元素。新版本改进了一致性,确保角色在不同片段中保持相同外观,并支持跨场景重复使用物体、背景和纹理,让视频更具表现力和创造性。
Q2:Veo现在支持什么格式的视频输出?
A:Veo现在支持垂直视频输出,用户可以选择原生9:16宽高比生成视频,可以直接上传到TikTok和YouTube Shorts等平台,无需手动裁剪。同时还支持将视频升级到4K分辨率,1080p视频质量也得到改进。
Q3:在哪些平台可以使用Veo的新功能?
A:谷歌将Veo改进的素材转视频和竖屏模式功能添加到Gemini应用中,并首次集成到YouTube Shorts和YouTube Create应用中。用户可以通过这些平台体验新的视频生成功能。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。