Runway AI 公司今天宣布完成了由 General Atlantic 领投的 3.08 亿美元融资。
参与本轮融资的还包括 Fidelity、Baillie Gifford、软银集团和英伟达等多家投资机构。英伟达此前还参与了 Runway 在 2023 年的 1.41 亿美元融资。据彭博社报道,这家人工智能创业公司目前估值超过 30 亿美元。
Runway 的这轮融资并不令人意外。早在去年 7 月,The Information 就报道 Runway 正在与 General Atlantic 就新一轮融资进行谈判。
这轮投资的消息发布前一天,Runway 刚推出了其最新的视频生成模型 Gen-4。用户只需提供一张参考图片和自然语言指令,该算法就能生成长达 10 秒的视频片段。它同时还具备图像生成功能。
与 Runway 之前的视频生成器相比,Gen-4 在保持视频帧间物体外观一致性方面有了显著提升。即使物体的背景发生变化,它也能保持这种一致性。
Runway 今天表示,新融资将用于支持其 AI 开发工作。公司网站上的一则招聘信息暗示,这项工程开发将重点关注增强其 AI 训练数据集。根据招聘信息,Runway 正在招聘一位机器学习总监,负责"建立并监督数据合作伙伴关系,为我们的 AI 模型获取高质量数据集"。
除了从外部合作伙伴获取训练数据外,该公司可能还计划在内部创建数据集。Runway 目前正在招聘编剧、视觉特效师和动画师。内部创意团队将使公司能够为其 AI 训练项目创建定制视频数据集。
另一则工程经理的招聘信息暗示,Runway 的开发路线图将优先考虑扩散模型和大语言模型。前者类型的神经网络是视频生成任务的首选。它们通过创建包含噪声的视频,然后gradually 将噪声替换为用户要求的视觉内容来生成视频片段。
大语言模型虽然不能生成视频,但大多数大语言模型所基于的 Transformer 架构可用于增强扩散模型。在某些情况下,用 Transformer 模块替换扩散模型的某些组件可以加快训练速度。
今天的融资轮应该能让 Runway 在与提供名为 Sora 的竞争性视频生成器的 OpenAI 的竞争中处于更有利地位。后者可以生成长达 20 秒的视频片段。本周早些时候,OpenAI 因"经历高流量"而暂时禁用了新用户使用 Sora 的视频生成功能。
图片来源:Runway
好文章,需要你的鼓励
本文探讨如何使用生成式AI和大语言模型作为倾听者,帮助用户表达内心想法。许多主流AI如ChatGPT、Claude等被设计成用户的"最佳伙伴",或试图提供心理健康建议,但有时用户只想要一个尊重的倾听者。文章提供了有效的提示词技巧,指导AI保持中性、尊重的态度,专注于倾听和理解,而非给出建议或判断。同时提醒用户注意隐私保护和AI的局限性。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。