Amazon 升级了其 AI 视频模型 Nova Reel,现在可以生成长达两分钟的视频。
Nova Reel 于 2024 年 12 月发布,是 Amazon 首次进军生成式视频领域的尝试。该模型与 OpenAI、Google 等公司的模型在这个快速发展的市场中展开竞争。
AWS 开发者倡导者 Elizabeth Fuentes 在一篇博客文章中解释说,最新的 Nova Reel 1.1 可以生成具有"一致风格"的"多镜头"视频。用户可以提供最多 4,000 个字符的提示,生成由 6 秒镜头组成的、长达两分钟的视频。
Nova Reel 1.1 还引入了一个名为"多镜头手动模式"的新功能。在这种模式下,模型可以参考图像和提示,对视频镜头的构图进行更精确的控制。据 Fuentes 介绍,在提供 1280x720 分辨率的图像和最多 512 字符的提示的情况下,多镜头手动模式可以生成包含多达 20 个镜头的视频。
Nova Reel 仅通过包括 Bedrock (Amazon 的 AI 开发套件) 在内的 AWS 平台和服务提供,客户需要申请特殊访问权限。与大多数生成式 AI 系统一样,人们对 Reel 的开发方法是否符合伦理存在质疑。
视频生成模型通过大量视频样本的训练来"学习"视频中的模式,从而生成新的视频片段。一些公司在未获得所有者或创作者许可的情况下,使用受版权保护的视频训练模型。当这些模型"重现"受版权保护的画面时,模型的使用者可能面临知识产权诉讼。
Amazon 尚未披露 Reel 的训练数据来源,也没有为可能向模型数据集提供视频的创作者提供明确的退出机制。不过,该公司表示,根据其赔偿政策,将保护因使用其模型生成的媒体而被指控侵犯版权的 AWS 客户。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。