Google 正让 Gemini Advanced 订阅者试用 Veo 2 —— 一款其宣称能够生成具有“电影级真实感”高分辨率影片的文本转视频 AI 模型。从今天起,订阅者可以在网页端和移动端的 Gemini 模型下拉菜单中选择 Veo 2,输入提示语进而生成一段 720p 分辨率、时长八秒的视频。
每位订阅者每月可生成的视频数量有限,Google 表示将在用户接近限制时进行通知。Veo 2 输出的视频格式为 MP4,但移动端用户还可以选择通过“分享”按钮将视频直接上传至 TikTok 和 YouTube。
Veo 2 使用以下提示生成了这段视频: "a low-angle shot of a pampered French bulldog wearing sunglasses, lounges on a plush daybed by a sparkling turquoise pool at a luxury resort, with palm trees swaying gently in the background, captured on a bright, sunny day."
GIF: Google
Google 表示,升级后的 AI 模型对 "real-world physics and human motion"(现实物理和人体运动)有了更深刻的理解,从而能够呈现 "fluid character movement, lifelike scenes and finer visual details across diverse subjects and styles"(流畅的角色动作、逼真的场景以及多样主题和风格下更精细的视觉细节)。使用 Veo 2 生成的视频均带有 SynthID 数字水印,标识这些视频均由 AI 创作。
这一片段是在 Veo 2 中通过描述 "an animated shot of a tiny mouse with oversized glasses, reading a book by the light of a glowing mushroom in a cozy forest den."(一个戴着超大眼镜的小老鼠,在舒适的森林巢穴中借由发光蘑菇的光芒阅读一本书)而创作的。
你现在可以为 Google 的 AI 视频模型提供摄像机方向指令
除了 Veo 2 之外,Google 还向 Google One AI Premium 订阅者推出了 Whisk Animate —— 这一工具可以利用 Veo 2 将一张图像转换为一段八秒的视频。该功能是在 Google 现有的 Whisk 工具基础上开发而成,后者可用于创建 AI 生成的图像混搭。现通过 Google Labs 向全球订阅者提供 Whisk Animate。
Google 于去年 12 月以早期访问方式首次推出 Veo 2,该工具在公司 Vertex AI 平台上每秒视频收费 50 美分。此后,YouTube 已将 Veo 2 添加至其实验性功能 Dream Screen 中,允许用户为 Shorts 创建 AI 生成的视频片段。
好文章,需要你的鼓励
国际能源署发布的2025年世界能源展望报告显示,全球AI竞赛推动创纪录的石油、天然气、煤炭和核能消耗,加剧地缘政治紧张局势和气候危机。数据中心用电量预计到2035年将增长三倍,全球数据中心投资预计2025年达5800亿美元,超过全球石油供应投资的5400亿美元。报告呼吁采取新方法实现2050年净零排放目标。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。