使用人工智能生成人物虚拟形象视频的平台 Synthesia Ltd. 在一轮后期融资中筹集了 1.8 亿美元,使公司估值达到 21 亿美元。
这家总部位于伦敦的公司今天表示,这轮 D 轮融资由风险投资公司 NEA 领投,使其估值较 2023 年上一轮融资的 10 亿美元翻了一倍多。现有投资方包括 GV、MMC Ventures 和 Firstmark,以及新投资方 World Innovation Lab、Atlassian Ventures 和 PSP Growth 也参与了本轮融资。
该公司开发的工具让企业用户能够快速生成和分发合成 AI 视频片段,可以创建替代真人的逼真、栩栩如生的人物虚拟形象。它还使用 AI 辅助视频的编辑和制作,无需使用复杂的制作软件。
去年,Synthesia 为其平台增加了多项更新,包括使用网络摄像头或智能手机创建的个性化虚拟形象,可以与用户本人的声音克隆配对。这个虚拟形象不仅外貌和声音都与本人相似,还能用 30 多种不同语言说话,同时具备全身动作功能,能在说话时做出手臂和手势动作。
对于不需要个性化功能的用户,平台提供超过 230 个预制的逼真虚拟形象,可以使用 140 多种语言进行演讲。Synthesia 的视频播放器能够自动以观众所用的语言播放,使视频分享变得更加便捷。该公司还增加了在同一场景中加入多个虚拟形象的功能,可以就任何话题重现对话场景。
"自从我们在 2017 年创立公司以来,我们一直相信 AI 会迅速将通信方式从文字转向视频和音频等高保真格式,"联合创始人兼首席执行官 Victor Riparbelli 表示。"这个愿景现在已经成为现实。"
Riparbelli 表示,公司拥有超过 60,000 名客户,包括世界最大的品牌和数千家小型企业。这笔新投资将用于支持公司的产品人才库发展。目前公司有 400 名员工。
展望未来,Synthesia 表示计划添加新功能,让企业用户能够为客户生成互动视频体验,如可点击热点、嵌入表单和测验等。公司还计划开发下一代 AI 虚拟形象,使其表现力更强,不仅限于简单的手臂和手部动作,还能在说话时运用全身肢体语言,如触摸臀部和交叉双臂等动作。
好文章,需要你的鼓励
这项由复旦、港科大等多校联合完成的研究首次系统性地解决了大型AI模型在识别场景文字时产生"语义幻觉"的问题。研究团队发现AI模型常将视觉上模糊的文字"脑补"成有意义但错误的词汇,并开发了包含ZoomText定位策略和接地层修正机制的训练无关解决方案,在多个基准测试中实现显著性能提升,为提高AI视觉系统可靠性提供了重要突破。
IBM研究院发布AssetOpsBench,全球首个工业资产AI代理评估平台。该研究建立了多代理协作框架,涵盖IoT数据采集、时序分析、故障诊断等专业模块,通过141个真实场景和六维评估标准测试AI在复杂工业运维中的表现。测试显示当前AI技术仍有改进空间,为工业4.0时代的智能运维发展提供重要基准。
韩国科学技术院研究团队开发出Simba方法,通过层次化稀疏化技术对状态空间模型进行"瘦身",在保持性能的同时显著提升计算效率。该方法采用类似高速公路的架构设计,让AI模型的上层只处理最重要的信息,实现了最高80%的速度提升和更好的长序列处理能力。这项即插即用的技术为AI模型优化提供了新思路。
这项研究展示了一个基于ModernBERT架构的prompt injection检测模型,通过精心构建的多样化数据集训练,在内部测试中达到98.7%准确率和98.0% F1分数,在公开基准测试中平均F1分数达93.8%,显著超越现有最强基线系统。该模型推理速度仅0.02秒,具备实时检测能力,为AI系统安全防护提供了新的解决方案。