使用人工智能生成人物虚拟形象视频的平台 Synthesia Ltd. 在一轮后期融资中筹集了 1.8 亿美元,使公司估值达到 21 亿美元。
这家总部位于伦敦的公司今天表示,这轮 D 轮融资由风险投资公司 NEA 领投,使其估值较 2023 年上一轮融资的 10 亿美元翻了一倍多。现有投资方包括 GV、MMC Ventures 和 Firstmark,以及新投资方 World Innovation Lab、Atlassian Ventures 和 PSP Growth 也参与了本轮融资。
该公司开发的工具让企业用户能够快速生成和分发合成 AI 视频片段,可以创建替代真人的逼真、栩栩如生的人物虚拟形象。它还使用 AI 辅助视频的编辑和制作,无需使用复杂的制作软件。
去年,Synthesia 为其平台增加了多项更新,包括使用网络摄像头或智能手机创建的个性化虚拟形象,可以与用户本人的声音克隆配对。这个虚拟形象不仅外貌和声音都与本人相似,还能用 30 多种不同语言说话,同时具备全身动作功能,能在说话时做出手臂和手势动作。
对于不需要个性化功能的用户,平台提供超过 230 个预制的逼真虚拟形象,可以使用 140 多种语言进行演讲。Synthesia 的视频播放器能够自动以观众所用的语言播放,使视频分享变得更加便捷。该公司还增加了在同一场景中加入多个虚拟形象的功能,可以就任何话题重现对话场景。
"自从我们在 2017 年创立公司以来,我们一直相信 AI 会迅速将通信方式从文字转向视频和音频等高保真格式,"联合创始人兼首席执行官 Victor Riparbelli 表示。"这个愿景现在已经成为现实。"
Riparbelli 表示,公司拥有超过 60,000 名客户,包括世界最大的品牌和数千家小型企业。这笔新投资将用于支持公司的产品人才库发展。目前公司有 400 名员工。
展望未来,Synthesia 表示计划添加新功能,让企业用户能够为客户生成互动视频体验,如可点击热点、嵌入表单和测验等。公司还计划开发下一代 AI 虚拟形象,使其表现力更强,不仅限于简单的手臂和手部动作,还能在说话时运用全身肢体语言,如触摸臀部和交叉双臂等动作。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。