2025年,随着大语言模型技术的爆发式发展,我们总在寻找下一个突破性技术。这种追逐可能令人疲惫,因此我们常常求助于他人的意见,在Reddit上寻找真实用户对某个模型的评价,或了解人们在博客圈之外的真实想法。
但有时,某些技术就是会脱颖而出,令人印象深刻。
Runway推出的"Whisper Thunder"模型,也就是4.5版本,是一个生成式AI巨擘,能够制作出极其强大的视频内容。早期演示显示,人物和动物在街道上奔跑、相互变形,体验着你在大银幕上才能看到的那种震撼效果——如果你还是那种在流媒体时代依然去电影院看电影的人。
那么,什么是Whisper Thunder?Runway又是什么公司?
黑马公司
遗憾的是,我们没有太多Reddit用户评论,甚至在YouTube上也找不到人们试用这项技术的实例,至少没有人愿意为自己的内容打上相关标签。
关于Runway的信息也很稀少——这不是OpenAI、谷歌或Anthropic。我挖掘到的信息显示,其投资者名单包括:General Atlantic、Baillie Gifford、英伟达和Salesforce Ventures。显然,黄仁勋知道这些人是谁。
在CNBC的采访中,Runway首席执行官Cristóbal Valenzuela透露了更多信息。他说这个新的图像生成模型是"一夜成功,但实际用了七年时间",并认可了AI行业的竞争激烈程度,这对很多人来说都很重要。
Valenzuela表示:"Runway很兴奋能够确保AI不会被两三家公司垄断。"
这次报道还透露了一个额外消息:4.5版本或Whisper Thunder在开发过程中的代号是"David",这个名字体现了公司作为行业黑马的地位。
Runway的精彩表现
我最喜欢的播客主持人之一Nathaniel Whittemore对Runway的新模型给出了这样的评价,虽然我相信他是在引用别人的话:
"Runway Gen 4.5处于技术前沿,为视频生成、动作质量、提示词遵循和视觉保真度设定了新标准。它在文本转视频排行榜上确实表现出色……看起来很多进步都符合我所说的'解锁分数',基本上就是那些能够解锁之前困难甚至不可能实现的用例的改进。"
作为参考,这里有一份来自Y Combinator Hacker News的功能快速列表:
"o 文本转视频:输入提示词,选择风格/比例,就能生成完整视频。
o 电影级质量:自然动作、一致场景、逼真光影——比大多数类似工具更稳定。
o 快速简便:无水印,无需付费,生成速度快——非常适合视频原型制作。
o 风格控制:支持真实、动画和电影风格,并能使用参考图像在镜头间保持一致性。"
这个模型值得关注,同时还有本周早些时候我写过的Nano Banana Pro,它也出现在了每个人的信息流中。这给OpenAI带来了严重压力,需要在模型领域保持领先于谷歌的快速发展。
敬请关注更多动态。
Q&A
Q1:Runway 4.5的Whisper Thunder模型有什么特点?
A:Whisper Thunder是Runway推出的4.5版本生成式AI模型,能够制作极其强大的视频内容。它具有电影级质量,支持自然动作、一致场景和逼真光影效果,比大多数类似工具更稳定,并且支持文本转视频、多种风格控制等功能。
Q2:Runway公司的背景如何?
A:Runway不是OpenAI、谷歌或Anthropic这样的知名公司,算是行业黑马。其投资者包括General Atlantic、Baillie Gifford、英伟达和Salesforce Ventures。CEO Cristóbal Valenzuela表示,公司致力于确保AI不被少数几家公司垄断。
Q3:为什么说Runway 4.5在技术上有突破?
A:根据评价,Runway Gen 4.5处于技术前沿,为视频生成、动作质量、提示词遵循和视觉保真度设定了新标准。它在文本转视频排行榜上表现出色,能够解锁之前困难甚至不可能实现的用例,代表了重要的技术进步。
好文章,需要你的鼓励
这款16英寸便携显示器采用分离式设计,包含显示屏和磁吸式支架,均由阳极氧化铝制成。支架采用双铰链设计,支持360度旋转调节,收纳时厚度仅约1.3厘米。FlipAction Pro Gen 1配备2560×1600分辨率、60Hz刷新率、350尼特亮度和100% DCI-P3色域。无需外接电源,可直接从设备取电。适合与iPad配合提升多任务处理效率,或作为Mac的垂直副屏使用。
印度学者在卫星图像识别领域取得突破,设计出无需预训练的神经网络架构,在EuroSAT数据集上达到97.23%准确率。通过三轮迭代优化,研究者发现卫星图像需要平衡空间和光谱两种特征,创新性地开发了可学习融合参数的双路径注意力机制。该方法证明了专用架构设计在特定领域的巨大潜力,为无法获得大规模预训练数据的应用场景提供了有效解决方案。
中兴通讯首席发展官崔丽在经济学人影响力AI创新亚洲2025峰会上分享了智能体AI战略愿景。她强调组织应从机械化向有机化转型,在不确定性中寻求稳定,保持敏捷适应变化。数字化和智能化转型需要长期投资,AI建立在数字和网络基础之上。在关键环节需要人机协同,大模型存在固有风险,而人类具备社会智能和道德判断。智能体AI正在重塑人才战略,未来最重要的三类人才是AI专家、AI高级用户和超越AI的高阶思维人才。
UC伯克利研究团队开发了ECHO框架,通过分析社交媒体上真实用户对GPT-4o图像生成的使用反馈,构建了更贴近实际需求的AI评测体系。该框架收集了超过31000个用户提示词,发现传统评测无法覆盖的复杂任务需求,并识别出用户关心的色彩偏移、身份保持等具体问题,为AI模型评估提供了全新的用户导向思路。