2025年,随着大语言模型技术的爆发式发展,我们总在寻找下一个突破性技术。这种追逐可能令人疲惫,因此我们常常求助于他人的意见,在Reddit上寻找真实用户对某个模型的评价,或了解人们在博客圈之外的真实想法。
但有时,某些技术就是会脱颖而出,令人印象深刻。
Runway推出的"Whisper Thunder"模型,也就是4.5版本,是一个生成式AI巨擘,能够制作出极其强大的视频内容。早期演示显示,人物和动物在街道上奔跑、相互变形,体验着你在大银幕上才能看到的那种震撼效果——如果你还是那种在流媒体时代依然去电影院看电影的人。
那么,什么是Whisper Thunder?Runway又是什么公司?
黑马公司
遗憾的是,我们没有太多Reddit用户评论,甚至在YouTube上也找不到人们试用这项技术的实例,至少没有人愿意为自己的内容打上相关标签。
关于Runway的信息也很稀少——这不是OpenAI、谷歌或Anthropic。我挖掘到的信息显示,其投资者名单包括:General Atlantic、Baillie Gifford、英伟达和Salesforce Ventures。显然,黄仁勋知道这些人是谁。
在CNBC的采访中,Runway首席执行官Cristóbal Valenzuela透露了更多信息。他说这个新的图像生成模型是"一夜成功,但实际用了七年时间",并认可了AI行业的竞争激烈程度,这对很多人来说都很重要。
Valenzuela表示:"Runway很兴奋能够确保AI不会被两三家公司垄断。"
这次报道还透露了一个额外消息:4.5版本或Whisper Thunder在开发过程中的代号是"David",这个名字体现了公司作为行业黑马的地位。
Runway的精彩表现
我最喜欢的播客主持人之一Nathaniel Whittemore对Runway的新模型给出了这样的评价,虽然我相信他是在引用别人的话:
"Runway Gen 4.5处于技术前沿,为视频生成、动作质量、提示词遵循和视觉保真度设定了新标准。它在文本转视频排行榜上确实表现出色……看起来很多进步都符合我所说的'解锁分数',基本上就是那些能够解锁之前困难甚至不可能实现的用例的改进。"
作为参考,这里有一份来自Y Combinator Hacker News的功能快速列表:
"o 文本转视频:输入提示词,选择风格/比例,就能生成完整视频。
o 电影级质量:自然动作、一致场景、逼真光影——比大多数类似工具更稳定。
o 快速简便:无水印,无需付费,生成速度快——非常适合视频原型制作。
o 风格控制:支持真实、动画和电影风格,并能使用参考图像在镜头间保持一致性。"
这个模型值得关注,同时还有本周早些时候我写过的Nano Banana Pro,它也出现在了每个人的信息流中。这给OpenAI带来了严重压力,需要在模型领域保持领先于谷歌的快速发展。
敬请关注更多动态。
Q&A
Q1:Runway 4.5的Whisper Thunder模型有什么特点?
A:Whisper Thunder是Runway推出的4.5版本生成式AI模型,能够制作极其强大的视频内容。它具有电影级质量,支持自然动作、一致场景和逼真光影效果,比大多数类似工具更稳定,并且支持文本转视频、多种风格控制等功能。
Q2:Runway公司的背景如何?
A:Runway不是OpenAI、谷歌或Anthropic这样的知名公司,算是行业黑马。其投资者包括General Atlantic、Baillie Gifford、英伟达和Salesforce Ventures。CEO Cristóbal Valenzuela表示,公司致力于确保AI不被少数几家公司垄断。
Q3:为什么说Runway 4.5在技术上有突破?
A:根据评价,Runway Gen 4.5处于技术前沿,为视频生成、动作质量、提示词遵循和视觉保真度设定了新标准。它在文本转视频排行榜上表现出色,能够解锁之前困难甚至不可能实现的用例,代表了重要的技术进步。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。