AI公司Midjourney发布了其首款视频模型。这一AI视频生成的初步尝试将允许用户为图像制作动画效果,无论是在Midjourney中创建的图像还是从其他来源上传的图像。初始生成结果为5秒钟的视频片段,用户可以选择延长4秒,最多可延长4次。目前视频生成功能仅在网页端可用,需要至少每月10美元的订阅才能使用。
Midjourney是AI生成静态图像领域的早期知名公司之一,尽管其他平台已在人工智能发展讨论中占据前沿地位。谷歌最新的I/O大会推出了多款AI视频生成工具,如文本转视频的Veo 3模型和为电影制作者设计的Flow工具。OpenAI去年发布的Sora也是文本转视频选项,而Adobe最新推出的Firefly视频模型可以根据文本或图像提示创建视频。
虽然在视频领域起步稍晚,但这并未阻止创意工作者对其提出指控,声称其模型训练存在违法行为。事实上,这一视频功能发布紧随一起针对该公司的诉讼。迪士尼和NBC环球上周以版权侵权为由起诉了Midjourney。与任何AI工具一样,滥用的可能性始终存在。不过Midjourney已礼貌地要求人们"请负责任地使用这些技术",相信不会出现问题。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。