Google 正让 Gemini Advanced 订阅者试用 Veo 2 —— 一款其宣称能够生成具有“电影级真实感”高分辨率影片的文本转视频 AI 模型。从今天起,订阅者可以在网页端和移动端的 Gemini 模型下拉菜单中选择 Veo 2,输入提示语进而生成一段 720p 分辨率、时长八秒的视频。
每位订阅者每月可生成的视频数量有限,Google 表示将在用户接近限制时进行通知。Veo 2 输出的视频格式为 MP4,但移动端用户还可以选择通过“分享”按钮将视频直接上传至 TikTok 和 YouTube。
Veo 2 使用以下提示生成了这段视频: "a low-angle shot of a pampered French bulldog wearing sunglasses, lounges on a plush daybed by a sparkling turquoise pool at a luxury resort, with palm trees swaying gently in the background, captured on a bright, sunny day."
GIF: Google
Google 表示,升级后的 AI 模型对 "real-world physics and human motion"(现实物理和人体运动)有了更深刻的理解,从而能够呈现 "fluid character movement, lifelike scenes and finer visual details across diverse subjects and styles"(流畅的角色动作、逼真的场景以及多样主题和风格下更精细的视觉细节)。使用 Veo 2 生成的视频均带有 SynthID 数字水印,标识这些视频均由 AI 创作。
这一片段是在 Veo 2 中通过描述 "an animated shot of a tiny mouse with oversized glasses, reading a book by the light of a glowing mushroom in a cozy forest den."(一个戴着超大眼镜的小老鼠,在舒适的森林巢穴中借由发光蘑菇的光芒阅读一本书)而创作的。
你现在可以为 Google 的 AI 视频模型提供摄像机方向指令
除了 Veo 2 之外,Google 还向 Google One AI Premium 订阅者推出了 Whisk Animate —— 这一工具可以利用 Veo 2 将一张图像转换为一段八秒的视频。该功能是在 Google 现有的 Whisk 工具基础上开发而成,后者可用于创建 AI 生成的图像混搭。现通过 Google Labs 向全球订阅者提供 Whisk Animate。
Google 于去年 12 月以早期访问方式首次推出 Veo 2,该工具在公司 Vertex AI 平台上每秒视频收费 50 美分。此后,YouTube 已将 Veo 2 添加至其实验性功能 Dream Screen 中,允许用户为 Shorts 创建 AI 生成的视频片段。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。