Google 正让 Gemini Advanced 订阅者试用 Veo 2 —— 一款其宣称能够生成具有“电影级真实感”高分辨率影片的文本转视频 AI 模型。从今天起,订阅者可以在网页端和移动端的 Gemini 模型下拉菜单中选择 Veo 2,输入提示语进而生成一段 720p 分辨率、时长八秒的视频。
每位订阅者每月可生成的视频数量有限,Google 表示将在用户接近限制时进行通知。Veo 2 输出的视频格式为 MP4,但移动端用户还可以选择通过“分享”按钮将视频直接上传至 TikTok 和 YouTube。
Veo 2 使用以下提示生成了这段视频: "a low-angle shot of a pampered French bulldog wearing sunglasses, lounges on a plush daybed by a sparkling turquoise pool at a luxury resort, with palm trees swaying gently in the background, captured on a bright, sunny day."
GIF: Google
Google 表示,升级后的 AI 模型对 "real-world physics and human motion"(现实物理和人体运动)有了更深刻的理解,从而能够呈现 "fluid character movement, lifelike scenes and finer visual details across diverse subjects and styles"(流畅的角色动作、逼真的场景以及多样主题和风格下更精细的视觉细节)。使用 Veo 2 生成的视频均带有 SynthID 数字水印,标识这些视频均由 AI 创作。
这一片段是在 Veo 2 中通过描述 "an animated shot of a tiny mouse with oversized glasses, reading a book by the light of a glowing mushroom in a cozy forest den."(一个戴着超大眼镜的小老鼠,在舒适的森林巢穴中借由发光蘑菇的光芒阅读一本书)而创作的。
你现在可以为 Google 的 AI 视频模型提供摄像机方向指令
除了 Veo 2 之外,Google 还向 Google One AI Premium 订阅者推出了 Whisk Animate —— 这一工具可以利用 Veo 2 将一张图像转换为一段八秒的视频。该功能是在 Google 现有的 Whisk 工具基础上开发而成,后者可用于创建 AI 生成的图像混搭。现通过 Google Labs 向全球订阅者提供 Whisk Animate。
Google 于去年 12 月以早期访问方式首次推出 Veo 2,该工具在公司 Vertex AI 平台上每秒视频收费 50 美分。此后,YouTube 已将 Veo 2 添加至其实验性功能 Dream Screen 中,允许用户为 Shorts 创建 AI 生成的视频片段。
好文章,需要你的鼓励
英国Oxford Quantum Circuits公司在曼哈顿数据中心安装了纽约市首台量子计算机,旨在为客户提供更快速高效的AI程序运行服务。该公司计划未来3-5年投资数千万美元,部分用于采购英伟达芯片进行集成。这一"量子-AI数据中心"项目预计将显著提升数据生成效率,特别有利于金融领域应用。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
人形机器人公司Figure AI宣布完成超过10亿美元的C轮融资,资金将用于扩大机器人生产、构建英伟达GPU基础设施以加速训练和仿真,并扩展人类工作生活数据收集。该公司目标是在未来四年内交付10万台人形机器人,其Figure 02机器人搭载Helix AI智能系统,能够理解未见过的物体并做出合理行动。英特尔、英伟达、LG等公司参与投资。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。