谷歌周四表示,正在通过其Gemini应用为Veo 3 AI视频生成器增加图像转视频生成功能。
该公司此前已在其AI驱动的视频工具Flow中推出了这项功能,Flow于5月在谷歌I/O开发者大会上首次发布。
在5月推出基于Veo 3的视频生成功能后,截至上周,谷歌已在150多个国家提供该功能。目前,只有Google AI Ultra和Google AI Pro计划用户可以生成视频,每天限制三次创作且不可累积。
谷歌表示,用户可以通过在提示框的工具菜单中选择"视频"选项并上传照片来生成视频片段。用户还可以通过在提示中描述音频来添加声音。视频生成后,可以下载或与他人分享。
该公司指出,自7周前发布以来,用户已通过Gemini应用和Flow工具创建了超过4000万个视频。所有使用Veo 3模型生成的视频都会带有显示"Veo"的可见水印,以及不可见的SynthID数字水印,这是谷歌AI工具用来识别AI生成数字内容的技术。
今年早些时候,该公司还发布了一个帮助检测包含SynthID内容的工具。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。