Runway AI 公司今天宣布完成了由 General Atlantic 领投的 3.08 亿美元融资。
参与本轮融资的还包括 Fidelity、Baillie Gifford、软银集团和英伟达等多家投资机构。英伟达此前还参与了 Runway 在 2023 年的 1.41 亿美元融资。据彭博社报道,这家人工智能创业公司目前估值超过 30 亿美元。
Runway 的这轮融资并不令人意外。早在去年 7 月,The Information 就报道 Runway 正在与 General Atlantic 就新一轮融资进行谈判。
这轮投资的消息发布前一天,Runway 刚推出了其最新的视频生成模型 Gen-4。用户只需提供一张参考图片和自然语言指令,该算法就能生成长达 10 秒的视频片段。它同时还具备图像生成功能。
与 Runway 之前的视频生成器相比,Gen-4 在保持视频帧间物体外观一致性方面有了显著提升。即使物体的背景发生变化,它也能保持这种一致性。
Runway 今天表示,新融资将用于支持其 AI 开发工作。公司网站上的一则招聘信息暗示,这项工程开发将重点关注增强其 AI 训练数据集。根据招聘信息,Runway 正在招聘一位机器学习总监,负责"建立并监督数据合作伙伴关系,为我们的 AI 模型获取高质量数据集"。
除了从外部合作伙伴获取训练数据外,该公司可能还计划在内部创建数据集。Runway 目前正在招聘编剧、视觉特效师和动画师。内部创意团队将使公司能够为其 AI 训练项目创建定制视频数据集。
另一则工程经理的招聘信息暗示,Runway 的开发路线图将优先考虑扩散模型和大语言模型。前者类型的神经网络是视频生成任务的首选。它们通过创建包含噪声的视频,然后gradually 将噪声替换为用户要求的视觉内容来生成视频片段。
大语言模型虽然不能生成视频,但大多数大语言模型所基于的 Transformer 架构可用于增强扩散模型。在某些情况下,用 Transformer 模块替换扩散模型的某些组件可以加快训练速度。
今天的融资轮应该能让 Runway 在与提供名为 Sora 的竞争性视频生成器的 OpenAI 的竞争中处于更有利地位。后者可以生成长达 20 秒的视频片段。本周早些时候,OpenAI 因"经历高流量"而暂时禁用了新用户使用 Sora 的视频生成功能。
图片来源:Runway
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。