总部位于纽约的AI视频平台公司Kaltura宣布,将以约2700万美元收购以色列初创公司eSelf.ai。eSelf专注于开发对话式虚拟形象技术,即能够与用户对话的AI生成数字人。
Kaltura今日宣布已签署收购eSelf的最终协议。eSelf平台支持30多种语言,并配备用户友好的工作室,用于创建、定制和部署逼真的数字虚拟形象。
eSelf成立于2023年,联合创始人兼CEO Alan Bekker此前曾将其首个初创公司Voca出售给Snap。联合创始人兼CTO Eylon Shoshan拥有深厚的技术专长,涵盖语音转视频生成、低延迟语音识别和屏幕理解技术,使虚拟形象能够看到并响应用户屏幕上的内容。
这家成立仅两年的初创公司拥有约15名AI专家组成的精干团队。Kaltura联合创始人兼CEO Ron Yekutiel表示,Bekker的前公司专门从事自然语言处理和计算机视觉技术,在对话式语音机器人领域处于领先地位。
Kaltura提供一系列基于云的软件解决方案,专为高级视频应用设计,包括类似私人YouTube的企业视频门户、网络研讨会和虚拟活动工具,以及将视频学习嵌入大学学习管理系统的集成功能。
这家纳斯达克上市公司还提供虚拟教室产品和端到端电视流媒体解决方案。Kaltura的视频平台服务超过800家企业客户,帮助他们在销售、营销、客户服务、教育和娱乐领域吸引用户。其客户包括亚马逊、甲骨文、Salesforce、SAP、Adobe和IBM等科技巨头,以及美国领先的银行、保险公司、咨询公司、制药公司和大学。
Kaltura计划将eSelf.ai的虚拟智能体技术整合到其视频产品中,旨在实现能够实时聆听、说话和解读用户屏幕的智能体。
Yekutiel在接受采访时表示:"这次收购具有重要战略意义。我们积极评估了多家公司以找到合适的匹配对象。我们确定eSelf在实时同步对话方面处于行业领先地位,不仅仅是点播视频的唇形同步,他们还拥有令人印象深刻的语音转文本和文本转语音技术栈。"
为何视频公司押注对话式虚拟形象
Yekutiel解释说,在过去二十年中,企业主要将视频用于流媒体播放、上传和管理内容。但这种情况正在快速改变。借助AI技术,视频现在可以即时生成,具有高度个性化和情境化特征,为每个观众提供定制体验,精确满足他们当时的需求。
"我们从视频开始,然后转向个性化视频,现在通过eSelf的技术,我们正在添加类人能力——面部、眼睛、嘴巴、耳朵——使我们的AI智能体具备对话和表达能力,"Yekutiel说。
Kaltura正在从视频平台演进为基于视频的客户和员工体验提供商,视频成为交互界面。与大多数只提供"面部"的虚拟形象公司不同,Kaltura提供完整的工作流程——虚拟形象、智能和企业连接的知识体系。重点不仅仅是流媒体视频,而是推动可衡量的业务成果和投资回报率。
公司计划推出独立的、可嵌入的智能体,用于销售、营销、客户支持和培训。目标行业包括教育、媒体和电信、电子商务、金融服务、医疗保健和制药。
这是Kaltura迄今为止的第四次收购。公司此前在2014年收购了云电视解决方案提供商Tvinci,2018年收购Rapt Media,2020年收购视频会议平台Newrow。eSelf最近一轮融资是在2024年12月宣布的450万美元。
Kaltura于2021年上市,年收入约1.8亿美元,在调整后的EBITDA和现金流基础上实现盈利,拥有约600名员工。
Q&A
Q1:eSelf是什么公司?它的主要技术是什么?
A:eSelf是以色列的AI初创公司,专注于开发对话式虚拟形象技术。它能创建可与用户对话的AI生成数字人,支持30多种语言,具备语音转视频生成、低延迟语音识别和屏幕理解等核心技术能力。
Q2:Kaltura为什么要收购eSelf?这次收购的价值是多少?
A:Kaltura以约2700万美元收购eSelf,主要是为了获得其实时同步对话技术和语音处理技术栈。这次收购符合Kaltura从视频平台向视频基础客户体验提供商转型的战略,旨在为AI智能体添加类人对话和表达能力。
Q3:收购后Kaltura计划如何使用eSelf的技术?
A:Kaltura计划将eSelf的虚拟智能体技术整合到其视频产品中,开发能够实时聆听、说话和解读用户屏幕的智能体。公司将推出用于销售、营销、客户支持和培训的独立可嵌入智能体,目标行业包括教育、金融、医疗和电商等领域。
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
Salesforce AI研究团队构建了首个大规模多模态文档RAG评测基准UniDoc-Bench,包含7万页真实PDF文档和1600个问答对,覆盖8个领域。研究发现文本图像融合检索策略显著优于单一模态和联合多模态方法,为未来AI文档理解系统提供了"分工合作"的设计思路。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
腾讯研究团队发现AI训练中"推理火花"现象,揭示低概率词汇如"等等"、"不过"等在维持AI探索能力中的关键作用。团队开发的低概率正则化方法通过精准保护有价值的低概率词汇,在数学推理任务中实现60.17%准确率,比传统方法提升2.66%,为AI创造性思维研究开辟新路径。