谷歌 AI 视频模型现可接受摄像机镜头指令控制

谷歌正在努力让其视频AI模型Veo 2的用户更容易制作电影般的生成内容和编辑真实影像。通过Google Cloud的Vertex AI平台,用户可以预览Veo 2的新功能,同时还有针对文本到图像生成器Imagen 3和音频相关AI模型的其他更新。这些新功能包括自动去除视频中不需要的背景、延展原始视频画面、添加电影技巧预设等,旨在提升AI视频生成和编辑的能力。

谷歌正致力于让其 Veo 2 视频 AI 模型的用户能够更轻松地制作具有电影感的生成内容并编辑真实视频素材。这些新的 Veo 2 功能可通过 Google Cloud 的 Vertex AI 平台预览体验，同时还包括对谷歌文本到图像生成器 Imagen 3 和音频相关 AI 模型的其他更新。

Veo 2 的新功能包括修复功能，根据谷歌的说法，可以自动移除"视频中不需要的背景图像、标志或干扰元素"，以及外扩功能，可以将原始视频的画面扩展为不同格式。后者将用 AI 生成的视频内容填充新的空间，使其与原始片段自然融合，类似于 Adobe 图像生成扩展功能。

当 Veo 2 将视频延展超出其原始边界时，空白区域会以生成的画面填充以保持匹配。

此次更新还允许 Veo 2 用户在生成视频时，除了文本描述外，还可以选择电影技法预设，这有助于指导最终成片的镜头构图、摄像机角度和节奏把控。预设示例包括延时效果、无人机视角以及模拟不同方向的摄像机平移。

系统还新增了一个插帧功能，可以在两张静态图像之间创建视频过渡，通过生成新的帧来填充开始和结束序列。

只需提供起点和终点，Veo 2 就能输出一段连接两者的视频。

Adobe 的竞品 Firefly 视频模型也具有类似功能，上周在 Premiere Pro 中推出了生成式 AI 视频扩展功能。谷歌同样在其 AI 生成的内容中添加 SynthID 数字归因水印，类似于 Adobe 的内容凭证系统。但 Adobe 更进一步，承诺其工具完全可以商用，因为它们是基于授权和公共领域内容训练的——这是谷歌在吸收网络内容训练其 AI 模型后无法做到的。

谷歌的文本到图像模型 Imagen 3 的编辑功能也得到更新，据谷歌称，自动对象移除功能得到"显著"改进，在移除干扰元素时能提供更自然的效果。Veo 2 和 Imagen 3 已经被欧莱雅和卡夫亨氏等公司用于营销内容制作，卡夫亨氏的数字体验负责人 Justin Thomas 表示，"过去需要八周的工作现在只需要八小时"。

在音频方面，谷歌已在私人预览版中发布了其文本到音乐模型 Lyria，并为其合成语音模型 Chirp 3 推出了"即时定制语音"功能。谷歌表示，Chirp 3 现在可以"从 10 秒的音频输入中生成逼真的定制语音"，同时还推出了预览版的转录功能，可以在多人对话的通话中识别并分离个别说话者，提供更清晰的转录内容。

这些更新只是谷歌今天发布的众多 AI 相关公告中的一部分。该公司效率优化的 Flash 模型的最新版本 Gemini 2.5 Flash 即将在 Vertex AI 上推出。谷歌表示，Gemini 2.5 Flash "根据任务的复杂性自动调整处理时间"，为简单请求提供更快的结果。

谷歌本周还更新了其面向企业的 Agentic AI 工具，允许 AI 代理之间相互通信，并在 PayPal 和 Salesforce 等平台上执行任务。同时，谷歌云市场将推出新的板块，供企业浏览和购买由第三方谷歌合作伙伴构建的 AI 代理。

来源：The Verge

0赞

好文章，需要你的鼓励

谷歌 AI 视频模型现可接受摄像机镜头指令控制

来源：The Verge

2025

04/10

09:41

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

Google 推出性能更快、更高效的 Gemini AI 模型

Google Workspace 升级，新增自动化流程和播客式内容摘要功能

谷歌 AI 视频模型现可接受摄像机镜头指令控制

Gemini 将为你的 Google Docs 文档制作播客

人工智能如何改变在线营销：内容之外的三种方式

IBM 改造传统大型机以运行生成式 AI 工作负载和智能代理

Amazon 表示其 AI 视频模型现可生成数分钟长的视频片段

AI 时代：平衡企业效率与创意完整性的挑战

Adobe 发布 Premiere Pro 生成式 AI 视频扩展功能

高通收购越南初创公司 VinAI 的生成式 AI 部门

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: