使用人工智能生成人物虚拟形象视频的平台 Synthesia Ltd. 在一轮后期融资中筹集了 1.8 亿美元,使公司估值达到 21 亿美元。
这家总部位于伦敦的公司今天表示,这轮 D 轮融资由风险投资公司 NEA 领投,使其估值较 2023 年上一轮融资的 10 亿美元翻了一倍多。现有投资方包括 GV、MMC Ventures 和 Firstmark,以及新投资方 World Innovation Lab、Atlassian Ventures 和 PSP Growth 也参与了本轮融资。
该公司开发的工具让企业用户能够快速生成和分发合成 AI 视频片段,可以创建替代真人的逼真、栩栩如生的人物虚拟形象。它还使用 AI 辅助视频的编辑和制作,无需使用复杂的制作软件。
去年,Synthesia 为其平台增加了多项更新,包括使用网络摄像头或智能手机创建的个性化虚拟形象,可以与用户本人的声音克隆配对。这个虚拟形象不仅外貌和声音都与本人相似,还能用 30 多种不同语言说话,同时具备全身动作功能,能在说话时做出手臂和手势动作。
对于不需要个性化功能的用户,平台提供超过 230 个预制的逼真虚拟形象,可以使用 140 多种语言进行演讲。Synthesia 的视频播放器能够自动以观众所用的语言播放,使视频分享变得更加便捷。该公司还增加了在同一场景中加入多个虚拟形象的功能,可以就任何话题重现对话场景。
"自从我们在 2017 年创立公司以来,我们一直相信 AI 会迅速将通信方式从文字转向视频和音频等高保真格式,"联合创始人兼首席执行官 Victor Riparbelli 表示。"这个愿景现在已经成为现实。"
Riparbelli 表示,公司拥有超过 60,000 名客户,包括世界最大的品牌和数千家小型企业。这笔新投资将用于支持公司的产品人才库发展。目前公司有 400 名员工。
展望未来,Synthesia 表示计划添加新功能,让企业用户能够为客户生成互动视频体验,如可点击热点、嵌入表单和测验等。公司还计划开发下一代 AI 虚拟形象,使其表现力更强,不仅限于简单的手臂和手部动作,还能在说话时运用全身肢体语言,如触摸臀部和交叉双臂等动作。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。