让聊天机器人和图像生成器靠边站吧:这是AI视频生成器的时代。
在过去两年中,几乎每家主要科技公司都推出了某种AI视频模型,标志着生成式AI技术的下一波浪潮。从Sora到谷歌的Veo 3再到Midjourney,这个市场迅速变得拥挤。AI视频是公司AI创意产品的巨大飞跃,随着生成式AI成为我们创建和在线观看内容的重要组成部分,这些工具值得关注。特别是在AI生成视频的合法性和伦理问题备受争议的情况下。
许多公司也有聊天机器人和图像生成器,但我惊讶地发现视频生成器存在独特差异。例如,我最喜欢的一些图像生成器功能出现在视频模型中,而其他功能明显缺失。由于选择众多,我整理了所有可以考虑的主要模型,包括它们的定价、隐私政策以及我对每个模型的实际测试。
这是您需要了解的关于AI视频生成器的一切。此列表会定期更新每个生成器的最新信息。
什么是AI视频生成器
AI视频生成器是科技公司使用生成式AI的最新方式之一。这些程序使用文本到视频和图像到视频技术,让您创建短视频片段。您输入称为提示词的简短描述,或上传要制作动画的图像,软件会创建完全由生成式AI制作的片段。这些AI视频通常长度在5到10秒之间,某些模型提供同步音频。由于这项技术是新的,可能出现错误——称为幻觉。
我现在可以使用哪些AI视频模型
您现在可以使用的AI视频生成器示例包括OpenAI的Sora、谷歌的Veo 3、Adobe Firefly和Midjourney的V1。它们都是付费程序,产生不错的结果,并让您通过控制面板自定义拍摄。Runway是共同创建Stable Diffusion图像生成器的AI初创公司,是另一个提供免费增值计划的AI视频选择。Luma、Pika和Ideogram的其他AI模型也可用。
OpenAI的Sora
Sora在2024年底加入ChatGPT家族,但真正让粉丝蜂拥而至的是2025年10月Sora 2的改版。您可能从OpenAI同名的新社交媒体应用中知道Sora这个名字。但Sora是原始AI视频模型的名称,您可以使用Sora创建视频,无需邀请码即可使用该应用。
通过网络浏览器,Sora是一个相当用户友好的程序。它没有像Dall-E 3那样的对话UI——您无法与Sora"聊天"来进行后续修改。相反,它更像传统的AI创意服务。在Sora中,您有一个面板来自定义视频的尺寸、长度和风格感觉。您可以输入提示词或上传图像供Sora制作动画,并可以使用一些编辑选项来完善您的视频。Sora视频还会自动添加水印,标明其AI来源。
Sora仅对付费ChatGPT用户开放。如果您是ChatGPT Plus用户(每月20美元),您每月将获得50个优先生成积分,可创建最长5秒的720p视频。升级到Pro层级(每月200美元)可获得更高的月度积分,包括500个优先/快速生成视频和无限制的放松生成视频。Pro订阅者还可以创建最高1080p的高分辨率视频,将视频时长延长至20秒,并可选择下载无水印视频。
OpenAI的隐私政策声明,除非您选择退出,否则可能会使用您的内容进行训练。要在Sora中执行此操作,请转到设置>常规,并关闭"为所有人改进模型"。您还可以在设置中将视频排除在公共探索信息流之外。
谷歌的Veo 3
谷歌的Veo 3 AI视频生成器在2025年I/O开发者大会上公开发布时让AI爱好者着迷。在我的测试中,我发现Veo 3比我对Veo 2令人失望的体验有了很好的提升,但真正的区别是听得见的:Veo 3可以生成音频并自动同步到您的视频片段。
Veo 3视频长8秒,720p分辨率,自动以水平16:9格式生成。这是一个非常强大的程序,视频详细而有趣,但它并非免疫于所有常见的AI错误和幻觉。
Veo 3通过每月20美元的Google AI Pro计划和面向电影制作人的Flow程序提供。您也可以在YouTube上试用Veo。创作者现在可以为他们的Shorts视频创建AI生成的背景,由Veo提供支持。
视频自动嵌入Google的SynthID水印(在片段上不可见)。Google Cloud的一般AI政策声明,在未经许可的情况下不会使用客户数据进行训练。
Midjourney V1
Midjourney是最受欢迎的AI图像生成器之一,刚刚发布了名为V1的首个AI视频模型。您可以使用Midjourney创建5到21秒长的720p分辨率视频片段。您可以通过Discord或其网站使用Midjourney。目前,视频生成对用户收费,但它是较便宜的选择之一,每月10美元。
Midjourney的隐私政策表示,它可以使用个人信息和您提示词中包含的信息来改进其服务。如果您在隐身模式下创建,那么您的AI图像将是私人的;否则它们将在公共画廊中分享。
我对Midjourney的性价比印象相当深刻,但您需要耐心并在提示词方面具体明确。
Adobe Firefly
Firefly的独立AI视频生成器现在可供您在计算机上使用,也可通过其Firefly移动应用使用。如果您熟悉Firefly的AI图像工具,视频生成器设置会感觉很熟悉。左侧面板让您自定义片段,它的额外好处是让您选择想要的动作类型(放大和缩小、左右移动等)。您还可以选择想要的摄像角度,比如如果您想用鸟瞰图模拟无人机镜头。
一些Creative Cloud计划包括Firefly访问权限,包括如果您为单个程序或所有Adobe应用付费。如果您没有现有的Adobe计划,可以尝试Firefly标准计划(每月10美元)来每月创建最多20个视频。如果您需要更多生成积分,Pro计划(每月30美元)让您每月获得最多70个视频。两个Firefly计划都附带无限制的AI图像生成。您的Firefly视频将长5秒,1080p无音频。
Adobe表示使用Firefly创建的视频在商业上是安全的,其AI政策声明不会使用您的内容进行训练。Firefly视频没有可见水印,但其内容凭证自动附加到您的作品。Firefly模型在许可和公共领域内容上训练。
Runway
AI爱好者可能认识Runway这家共同创建流行AI图像生成器Stable Diffusion的初创公司。您可能还从去年秋天它与主要电影制片厂达成的里程碑式交易中认识Runway。狮门影业同意开放其目录——数千小时的电影如《饥饿游戏》和《疾速追杀》以及电视节目如《广告狂人》——用于为工作室创建自定义AI模型。
在我对该服务的简短测试中,我对提示词构建工具和总体易用性印象深刻。我之前也在Canva的Magic Media应用中使用过该服务,如果您是Canva爱好者,这很方便。您可以在其网络应用上免费使用Runway,每月125个积分——每次生成大约使用20个积分,所以限制很低。升级(每月15美元或每年144美元)可获得625个月度积分,访问更新模型,并能够将视频放大到4K并下载无水印版本。
Runway的服务条款表示它可以使用您的提示词和生成的视频训练其AI,但不保留对它们的所有权。其隐私政策还声明Runway可能向关联公司、业务和营销合作伙伴披露您的信息。您制作的视频自动私有。
还有哪些其他AI视频项目
值得注意的是,Meta公司没有出现在此列表中。该公司已投入资源开发AI,但它没有公开可用的AI视频生成器。它在2024年10月预告了一个版本。以下是我们目前所知的情况。
Meta的Movie Gen
Meta的AI视频模型——Movie Gen——目前只是一个研究概念,不公开可用,何时推出也没有消息。
由于Meta发布的研究论文,我们知道Movie Gen视频可能是1080p高清,最长16秒,每秒16帧。Movie Gen最值得注意的是同步音频的可能性。Meta表示Movie Gen还可用于创建长达45秒的音效、环境噪音和器乐。这个功能总有可能不会进入最终版本,但会给Meta带来优势。
也许像谷歌和YouTube一样,我们会看到一些AI驱动的功能首先出现在其社交平台Instagram和Facebook上。Meta用于其聊天机器人和图像生成器的AI模型在公开可用的Facebook和Instagram内容以及许可数据上训练。
Q&A
Q1:Sora 2有什么新功能?需要付费吗?
A:Sora 2是OpenAI对原版Sora的重大改版,提供更好的视频生成质量。仅对付费ChatGPT用户开放,Plus用户(每月20美元)可获得50个优先生成积分,创建最长5秒的720p视频。Pro用户(每月200美元)可创建更高分辨率、更长时长的视频。
Q2:Veo 3相比其他AI视频生成器有什么优势?
A:Veo 3的最大优势是能够生成音频并自动同步到视频片段,这是许多其他AI视频生成器缺乏的功能。它生成8秒长的720p视频,通过每月20美元的Google AI Pro计划提供,并且在YouTube上也有应用。
Q3:Adobe Firefly视频生成器适合商业使用吗?
A:是的,Adobe明确声明使用Firefly创建的视频在商业上是安全的,其AI政策承诺不会使用用户内容进行训练。Firefly模型在许可和公共领域内容上训练,视频自动附加内容凭证但没有可见水印。
好文章,需要你的鼓励
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
微软研究院发布突破性多语言AI技术UPDESH,通过"自下而上"数据生成策略,让AI真正理解不同文化背景下的语言表达。该技术基于各语言维基百科内容生成950万个训练数据点,覆盖13种印度语言,显著提升低资源语言AI性能,为构建文化敏感型AI系统提供新路径。
麻省理工学院研究发现过度依赖AI会导致认知债务,削弱基本思维能力。研究表明交替进行无辅助思考和AI支持工作的模式能保持认知敏锐度。这种认知高强度间歇训练模仿体能训练中的HIIT模式,通过短时间高强度思考与恢复期交替进行,可以强化大脑神经回路,防止认知衰退,提升独立思考能力。
NVIDIA团队提出RLBFF方法,将AI训练中的复杂评价转化为明确的二元判断标准,解决了传统人类反馈模糊和可验证奖励局限的问题。该方法在多个权威测试中取得突破性成果,其中JudgeBench获得第一名,训练的模型性能媲美知名商业模型但成本仅为其5%,为AI训练领域带来重要方法论创新。