视频编辑应用Captions的制造商Mirage已从General Catalyst客户价值基金(CVF)获得7500万美元成长融资。
在过去的一年里,这家初创公司在产品和企业身份方面都发生了重大变化。该公司从Captions更名为Mirage,将自己定位为一个AI实验室,生产不同的模型,同时也服务于广告和营销等行业。它还专门训练了一个针对短视频节奏、构图和注意力动态的模型。
该公司还在2025年1月转向免费增值模式,以更好地与字节跳动的CapCut和Meta年后发布的Edits等应用竞争。现在它还提供视频创作套件,包含Captions的一些功能,让公司能够批量创建和分发视频。
Mirage联合创始人兼首席执行官Gaurav Misra表示,公司的目标是创建更多模型。不过,他没有具体说明下一组模型的功能,只是说它们将专注于"装配智能"——基本上就是使用不同来源和组件来组合视频。
谈到Mirage的新音频模型时,该模型声称能在生成的视频中保留口音,Misra说:"开发音频模型的原因是我们注意到口音方面存在差距,因为我们很多用户都是国际用户。口音非常重要。我自己父亲的例子就是这样。他试图使用这个应用,他会用印度口音说一个词,但应用总是让他听起来像是在用美国口音说话。"
根据分析公司AppFigures的数据,Captions在过去365天内被下载超过320万次,应用内收入达到2840万美元。Misra表示,该平台迄今为止已被用于创建超过2亿个视频,并且吸引了国际用户群,只有25%的收入来自美国。
目前,Mirage的营销套件在网页上可用,而Captions主要提供移动优先的编辑套件。该公司旨在合并这两个平台,以更好地针对可能希望创建营销视频的小企业。
General Catalyst CVF基金的董事总经理Pranav Singhvi表示,Mirage具有出色的产品市场契合度。
"Mirage的商业模式已经非常完善。他们确切知道如何花费每一美元并产生非常有吸引力的投资回报率。如果你考虑他们要进入的市场,在某种意义上这是一个无限的总可寻址市场。你可以从创作者世界、影响者世界开始,然后将其作为向企业销售的机制,"Singhvi告诉TechCrunch。
有很多公司在为营销构建AI视频生成流水线。Canva推出了几个围绕营销创建和跟踪的工具,而D-ID、HeyGen、Webflow和Avataar等平台一直在发布新模型和功能。
然而,Singhvi对Mirage的定位和单位经济学似乎很有信心。"无论其他工具如何,从单位经济学的角度来看,Mirage显然领先于其他竞争者。最终,这都反映了他们的产品质量,"他说。
Mirage旨在利用新资本推动增长,并在高增长的亚洲市场扩张。
Q&A
Q1:Mirage是什么公司?它主要做什么业务?
A:Mirage是一家AI实验室公司,原名Captions,主要制造视频编辑应用。该公司开发不同的AI模型,服务于广告和营销等行业,专门训练了针对短视频节奏、构图和注意力动态的模型。
Q2:Mirage的音频模型有什么特殊功能?
A:Mirage的音频模型能够在生成的视频中保留口音。这是因为他们发现很多国际用户在使用应用时,原本的印度口音等会被转换成美国口音,所以开发了这个模型来解决口音保留问题。
Q3:Mirage的商业表现如何?用户规模多大?
A:根据数据显示,Captions应用在过去365天内被下载超过320万次,应用内收入达到2840万美元。该平台已被用于创建超过2亿个视频,拥有国际用户群,只有25%的收入来自美国。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。