Runway在过去七年中一直专注为创意产业构建视觉生成工具,如今该公司发现了技术应用的新机遇:机器人行业。
这家总部位于纽约的公司以其视频和图像生成AI世界模型而闻名,这些大语言模型能够创建真实世界的模拟版本。最近,该公司在3月份发布了视频生成模型Gen-4,并在7月推出了视频编辑模型Runway Aleph。
Runway联合创始人兼CTO Anastasis Germanidis在接受TechCrunch采访时表示,随着Runway世界模型的不断改进和逼真度提升,公司开始收到来自机器人和自动驾驶汽车公司的合作询问,这些公司希望使用这项技术。
"我们认为这种模拟世界的能力在娱乐之外具有广泛用途,尽管娱乐仍然是我们一个不断增长的重要领域,"Germanidis说道。"这使得训练与真实世界交互的[机器人]策略变得更加可扩展和成本效益更高,无论是在机器人领域还是自动驾驶领域。"
Germanidis表示,与机器人和自动驾驶汽车公司合作并非Runway在2018年成立时的初衷。直到机器人和其他行业的公司主动联系,该公司才意识到他们的模型具有比最初想象更广泛的应用场景。
机器人公司正在使用Runway的技术进行训练模拟,Germanidis说。他补充道,仅在真实世界场景中训练机器人和自动驾驶汽车对公司来说成本高昂、耗时很长且难以规模化。
虽然Runway知道自己无法完全取代真实世界的训练,但Germanidis表示,公司可以通过在Runway模型上运行模拟获得巨大价值,因为这些模型能够实现极其精确的控制。
与真实世界训练不同,使用这些模型可以更容易地测试特定变量和情况,而无需改变场景中的其他任何因素,他补充说。
"你可以退一步,然后模拟不同行动的效果,"他说。"如果汽车选择这个转弯而不是那个,或者执行这个动作,结果会是什么?从相同的上下文创建这些推演,在物理世界中是一件非常困难的事情,基本上要保持环境的所有其他方面相同,只测试你想要采取的特定行动的效果。"
Runway并非唯一一家致力于解决这一问题的公司。例如,英伟达本月早些时候发布了其Cosmos世界模型的最新版本,以及其他机器人训练基础设施。
Germanidis表示,该公司不打算为机器人和自动驾驶汽车客户发布"完全独立的模型系列"。相反,Runway将对其现有模型进行微调,以更好地服务这些行业。该公司还正在组建一个专门的机器人团队。
Germanidis补充说,虽然这些行业并不在公司最初向投资者的推介中,但投资者支持这一扩张。Runway已从英伟达、谷歌和General Atlantic等投资者那里筹集了超过5亿美元资金,估值达30亿美元。
"我们对公司的理解是建立在一个原则之上,而不是基于市场,"Germanidis说。"这个原则就是模拟的理念,能够构建越来越好的世界表征。一旦你拥有了这些真正强大的模型,你就可以将它们用于各种不同的市场、各种不同的行业。我们预期的行业已经存在,并且由于生成式模型的强大力量,它们将发生更大的变化。"
Q&A
Q1:Runway的世界模型是什么?有什么特点?
A:Runway的世界模型是能够创建真实世界模拟版本的大语言模型,主要用于视频和图像生成。这些模型的特点是逼真度不断提升,能够进行精确的场景模拟,最新产品包括视频生成模型Gen-4和视频编辑模型Runway Aleph。
Q2:机器人公司如何使用Runway的技术?
A:机器人公司主要使用Runway的技术进行训练模拟。相比在真实世界中训练机器人和自动驾驶汽车,使用Runway的模型进行模拟训练更加成本效益高、可扩展,并且能够在保持其他环境因素不变的情况下测试特定变量和行动的效果。
Q3:Runway会为机器人行业开发专门的产品吗?
A:Runway不打算发布完全独立的机器人行业模型系列,而是会对现有模型进行微调以更好地服务机器人和自动驾驶汽车行业。同时,公司正在组建专门的机器人团队来支持这一业务扩张。
好文章,需要你的鼓励
NVIDIA研究团队开发出名为Lyra的AI系统,能够仅凭单张照片生成完整3D场景,用户可自由切换观察角度。该技术采用创新的"自蒸馏"学习方法,让视频生成模型指导3D重建模块工作。系统还支持动态4D场景生成,在多项测试中表现优异。这项技术将大大降低3D内容创作门槛,为游戏开发、电影制作、VR/AR应用等领域带来重大突破。
生物技术公司SpotitEarly开发了一种独特的居家癌症筛查方法,结合训练有素的比格犬嗅觉能力和AI技术分析人体呼气样本。该公司研究显示,18只训练犬能以94%的准确率检测出早期癌症。用户只需在家收集呼气样本并寄送至实验室,由训练犬识别癌症特异性气味,AI平台验证犬类行为。公司计划明年通过医师网络推出筛查套件,单项癌症检测约250美元。
谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。