Google 正让 Gemini Advanced 订阅者试用 Veo 2 —— 一款其宣称能够生成具有“电影级真实感”高分辨率影片的文本转视频 AI 模型。从今天起,订阅者可以在网页端和移动端的 Gemini 模型下拉菜单中选择 Veo 2,输入提示语进而生成一段 720p 分辨率、时长八秒的视频。
每位订阅者每月可生成的视频数量有限,Google 表示将在用户接近限制时进行通知。Veo 2 输出的视频格式为 MP4,但移动端用户还可以选择通过“分享”按钮将视频直接上传至 TikTok 和 YouTube。
Veo 2 使用以下提示生成了这段视频: "a low-angle shot of a pampered French bulldog wearing sunglasses, lounges on a plush daybed by a sparkling turquoise pool at a luxury resort, with palm trees swaying gently in the background, captured on a bright, sunny day."
GIF: Google
Google 表示,升级后的 AI 模型对 "real-world physics and human motion"(现实物理和人体运动)有了更深刻的理解,从而能够呈现 "fluid character movement, lifelike scenes and finer visual details across diverse subjects and styles"(流畅的角色动作、逼真的场景以及多样主题和风格下更精细的视觉细节)。使用 Veo 2 生成的视频均带有 SynthID 数字水印,标识这些视频均由 AI 创作。
这一片段是在 Veo 2 中通过描述 "an animated shot of a tiny mouse with oversized glasses, reading a book by the light of a glowing mushroom in a cozy forest den."(一个戴着超大眼镜的小老鼠,在舒适的森林巢穴中借由发光蘑菇的光芒阅读一本书)而创作的。
你现在可以为 Google 的 AI 视频模型提供摄像机方向指令
除了 Veo 2 之外,Google 还向 Google One AI Premium 订阅者推出了 Whisk Animate —— 这一工具可以利用 Veo 2 将一张图像转换为一段八秒的视频。该功能是在 Google 现有的 Whisk 工具基础上开发而成,后者可用于创建 AI 生成的图像混搭。现通过 Google Labs 向全球订阅者提供 Whisk Animate。
Google 于去年 12 月以早期访问方式首次推出 Veo 2,该工具在公司 Vertex AI 平台上每秒视频收费 50 美分。此后,YouTube 已将 Veo 2 添加至其实验性功能 Dream Screen 中,允许用户为 Shorts 创建 AI 生成的视频片段。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。