Google 正让 Gemini Advanced 订阅者试用 Veo 2 —— 一款其宣称能够生成具有“电影级真实感”高分辨率影片的文本转视频 AI 模型。从今天起,订阅者可以在网页端和移动端的 Gemini 模型下拉菜单中选择 Veo 2,输入提示语进而生成一段 720p 分辨率、时长八秒的视频。
每位订阅者每月可生成的视频数量有限,Google 表示将在用户接近限制时进行通知。Veo 2 输出的视频格式为 MP4,但移动端用户还可以选择通过“分享”按钮将视频直接上传至 TikTok 和 YouTube。
Veo 2 使用以下提示生成了这段视频: "a low-angle shot of a pampered French bulldog wearing sunglasses, lounges on a plush daybed by a sparkling turquoise pool at a luxury resort, with palm trees swaying gently in the background, captured on a bright, sunny day."
GIF: Google
Google 表示,升级后的 AI 模型对 "real-world physics and human motion"(现实物理和人体运动)有了更深刻的理解,从而能够呈现 "fluid character movement, lifelike scenes and finer visual details across diverse subjects and styles"(流畅的角色动作、逼真的场景以及多样主题和风格下更精细的视觉细节)。使用 Veo 2 生成的视频均带有 SynthID 数字水印,标识这些视频均由 AI 创作。
这一片段是在 Veo 2 中通过描述 "an animated shot of a tiny mouse with oversized glasses, reading a book by the light of a glowing mushroom in a cozy forest den."(一个戴着超大眼镜的小老鼠,在舒适的森林巢穴中借由发光蘑菇的光芒阅读一本书)而创作的。
你现在可以为 Google 的 AI 视频模型提供摄像机方向指令
除了 Veo 2 之外,Google 还向 Google One AI Premium 订阅者推出了 Whisk Animate —— 这一工具可以利用 Veo 2 将一张图像转换为一段八秒的视频。该功能是在 Google 现有的 Whisk 工具基础上开发而成,后者可用于创建 AI 生成的图像混搭。现通过 Google Labs 向全球订阅者提供 Whisk Animate。
Google 于去年 12 月以早期访问方式首次推出 Veo 2,该工具在公司 Vertex AI 平台上每秒视频收费 50 美分。此后,YouTube 已将 Veo 2 添加至其实验性功能 Dream Screen 中,允许用户为 Shorts 创建 AI 生成的视频片段。
好文章,需要你的鼓励
SecurityPal成立于2020年,专门处理企业间技术采购中的安全合规问卷。该公司结合AI引擎与位于尼泊尔加德满都的240人分析师团队,帮助供应商和买方快速完成安全评估。平台维护着250万个安全问题的专有语料库,采用"人机协作"模式确保准确性。客户包括OpenAI、Figma等知名企业,服务承诺24小时内完成问卷处理,相比传统手动流程速度提升高达87倍。
T-Tech公司研究团队开发了SAE Boost助推器系统,通过训练专门的"错误补偿器"来增强AI理解工具对专业领域的理解能力。该系统在化学、俄语和外交等领域测试中显示出显著改进效果,同时完全保持原有通用能力。这种模块化设计为AI系统的持续优化提供了安全可靠的路径,对AI可解释性研究具有重要意义。
谷歌CEO桑达尔·皮查伊在财报电话会议上表示,对与OpenAI在云计算领域的合作感到"非常兴奋"。尽管OpenAI是谷歌在AI领域的最大竞争对手,但这一合作为谷歌云带来了重要客户。谷歌云第二季度收入增长至136亿美元,同比增长32%。该合作关系颇为微妙,OpenAI可能会利用谷歌的云基础设施来挑战谷歌的核心搜索业务。
斯坦福大学研究团队开发出革命性AI系统,能够像生物学家一样"看懂"蛋白质三维结构并预测功能。该系统通过多层次分析方法,在蛋白质功能预测方面达到90%以上准确率,为新药开发和精准医疗开辟新道路。这项技术不仅加速了蛋白质研究进程,更为解决复杂疾病提供了强大的AI助手,预示着人工智能与生物医学融合的美好前景。