Runway发布首个世界模型，为最新视频模型增加原生音频功能

AI视频生成公司Runway推出首个世界模型GWM-1，通过逐帧预测创建具备物理理解能力的仿真环境。该公司还发布了三个专门版本：GWM-Worlds用于交互式场景创建，GWM-Robotics利用合成数据训练机器人，GWM-Avatars模拟真实人类行为。同时，Runway更新了Gen 4.5模型，新增原生音频和长视频生成功能，支持一分钟视频制作及多镜头叙事。

随着AI图像和视频生成公司Runway加入越来越多的初创公司和大型科技公司行列，推出其首个世界模型，世界模型发布竞赛正式拉开帷幕。该公司表示，这个名为GWM-1的模型通过逐帧预测工作，创建具有物理理解能力的仿真，并且了解世界如何随时间实际运行。

世界模型是一种AI系统，它学习世界运行方式的内部仿真，因此可以进行推理、规划和行动，而无需针对现实生活中每种可能的场景进行训练。

本月早些时候，Runway推出了Gen 4.5视频模型，在Video Arena排行榜上超越了谷歌和OpenAI。该公司表示，其GWM-1世界模型比谷歌的Genie-3和其他竞争对手更"通用"。该公司将其定位为一个可以创建仿真来训练不同领域智能体的模型，如机器人技术和生命科学。

该公司首席技术官Anastasis Germanidis在直播中说："要构建世界模型，我们首先需要构建一个真正出色的视频模型。我们相信构建世界模型的正确路径是教会模型直接预测像素，这是实现通用仿真的最佳方式。在足够的规模和正确的数据下，你可以构建一个对世界运行方式有充分理解的模型。"

Runway发布了新世界模型的特定版本，称为GWM-Worlds、GWM-Robotics和GWM-Avatars。

GWM-Worlds是该模型的一个应用程序，让用户创建交互式项目。用户可以通过提示或图像参考设置场景，当您探索空间时，模型会生成具有几何、物理和光照理解的世界。该公司提到仿真以24fps和720p分辨率运行。Runway表示，虽然Worlds对游戏很有用，但它也非常适合教授智能体如何在物理世界中导航和行为。

通过GWM-Robotics，该公司旨在使用合成数据，并添加新参数如变化的天气条件或障碍物。Runway表示，这种方法还可以揭示机器人在不同场景下何时以及如何违反政策和指令。

Runway还在GWM-Avatars下构建逼真的虚拟形象来模拟人类行为。D-ID、Synthesia、Soul Machines甚至谷歌等公司都致力于创建看起来真实的人类虚拟形象，并在通信和培训等领域工作。

该公司指出，从技术上讲，Worlds、Robotics和Avatars是独立的模型，但最终计划将所有这些合并为一个模型。

除了发布新的世界模型外，该公司还在更新本月早些时候发布的基础Gen 4.5模型。新更新为模型带来了原生音频和长篇多镜头生成功能。该公司表示，使用这个模型，用户可以生成一分钟的视频，具有角色一致性、原生对话、背景音频和各种角度的复杂镜头。该公司说，您还可以编辑现有音频和添加对话。此外，您可以编辑任意长度的多镜头视频。

Gen 4.5更新使Runway更接近竞争对手Kling的一体化视频套件，后者也在本月早些时候推出，特别是在原生音频和多镜头叙事方面。这也表明视频生成模型正在从原型转向生产就绪工具。Runway更新的Gen 4.5模型对所有付费计划用户可用。

该公司表示将通过SDK提供GWM-Robotics。它补充说，正在与多家机器人公司和企业就GWM-Robotics和GWM-Avatars的使用进行积极对话。

Q&A

Q1：GWM-1世界模型是什么？它有什么特殊功能？

A：GWM-1是Runway发布的首个世界模型，通过逐帧预测工作，能够创建具有物理理解能力的仿真，了解世界如何随时间实际运行。它比谷歌的Genie-3等竞争对手更"通用"，可以创建仿真来训练机器人技术和生命科学等不同领域的智能体。

Q2：GWM-Worlds应用程序能做什么？

A：GWM-Worlds让用户创建交互式项目，可以通过提示或图像参考设置场景。当用户探索空间时，模型会生成具有几何、物理和光照理解的世界，仿真以24fps和720p分辨率运行，适合游戏开发和教授智能体在物理世界中的导航行为。

Q3：Runway Gen 4.5模型更新增加了哪些新功能？

A：更新后的Gen 4.5模型增加了原生音频和长篇多镜头生成功能，用户可以生成一分钟的视频，具有角色一致性、原生对话、背景音频和各种角度的复杂镜头。还可以编辑现有音频、添加对话，以及编辑任意长度的多镜头视频。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Runway发布首个世界模型，为最新视频模型增加原生音频功能

来源：Techcrunch

2025

12/12

08:10

分享

点赞

重塑亚太科技格局的五大力量：从数字主权到 AI 赋能的基础设施

迪士尼授权超200个角色给OpenAI，开启生成式AI新合作

OpenAI发布GPT-5.2挑战谷歌和Anthropic

Oracle预计OCI利润率将提升30-40%

A2A协议与AAIF基金会竞相制定AI智能体互通标准

AI语音技术助力创业者提升四倍工作效率

两相液体冷却如何解决热管理危机

东芝与Quantum Corridor实现量子安全网络通信重大突破

甲骨文AI投资支出激增致股价创24年最大跌幅

Oracle携手OpenAI构建企业级AI平台引发关注

Runway发布首个世界模型，为最新视频模型增加原生音频功能

首届全国独角兽企业大赛总决赛在甬开幕

研究人员利用300万天Apple Watch数据训练疾病检测AI

CoreWeave CEO 为 AI 循环交易辩护称其为"协作共赢"

IT领导者不可忽视的生成式AI价值实现五大趋势

AI安全监管亟待加强，头部科技公司评分不及格

TPU挑战GPU霸主地位，谷歌专用芯片崛起

2026年AI预测：自动化发展与工作未来的十大趋势

亚马逊计划2030年前在印度投资350亿美元聚焦AI与物流

Adobe将Photoshop、Acrobat和Adobe Express集成至ChatGPT

Google DeepMind与Apptronik展示家用人形机器人执行真实世界任务

HSD立标杆、生态促普惠，地平线将城区辅助驾驶带入十万级国民市场

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: