客户支持与服务是当前语音AI领域最火热的赛道之一。然而,打造一款听起来像真人、响应无明显延迟的产品,在某些市场中难度远超其他地区——而大多数主流玩家在设计之初,根本没有将非洲和中东市场纳入考量。
AethexAI是一家去年成立的初创公司,致力于填补这一空白。该公司已完成300万美元的种子前轮融资,由4DX Ventures领投,Enza Capital、Dorm Room Fund、Mojo Ventures和斯坦福商学院26届基金参与跟投。个人投资者包括斯坦福大学教职人员、电信高管以及来自Anthropic的AI研究人员。
与使用Vapi和LiveKit等现有编排工具不同,AethexAI从零开始构建了自己的小型模型和编排层,专门处理其目标市场中英语、法语和阿拉伯语的本地方言——这一决策正是由该地区的特殊需求所驱动的。
该公司同时发布了面向企业的平台,供用户试用其技术并注册服务,另附面向开发者的API和SDK,方便他们对模型进行探索实验。
AethexAI由Mariama Diallo和Ayooluwa Odemuyiwa共同创立。CEO Diallo曾任职于高盛,后加入YC支持的ModelML,负责产品与增长工作。CTO Odemuyiwa毕业于加州理工学院,曾在Meta工作,后就读于斯坦福商学院,随后联合创办了这家公司。两人希望为新兴市场打造有价值的产品,并由此开始寻找市场机会。
全球各地的企业正竞相采用AI工具来实现业务自动化,但效果并不总是理想。据两位创始人了解,埃及一家呼叫中心曾对大量通话实施自动化处理,但因效果不佳最终回滚了系统。非洲多家客服中心也反映,以合理成本找到并招募工程师来实现通话自动化,始终是一个棘手难题。
"我们在该地区的自动化通话中观察到的延迟和抖动问题触目惊心。如果我们只做编排层,可能不得不使用托管在区域外的大型模型,导致延迟更高。我们意识到,要让系统真正可用,必须使用非常小的模型,并在每个环节压缩延迟。"CTO Odemuyiwa在接受TechCrunch采访时谈及自建模型和编排层的初衷。
AI实验室部署最新模型时,通常需要耗费数百万美元用于训练和数据采集。AethexAI则找到了一条兼顾两者的解决路径。他们没有追求最大规模的模型,而是判断小型模型足以在保证准确率的同时解决延迟问题,并由此开发出自家的Kora系列模型,参数量从3亿到17亿不等。与大语言模型相比,这仅是其体量的一小部分,而这正是他们的核心策略所在。
为训练这些模型,该公司使用了来自呼叫中心合作伙伴的匿名录音,并向非洲各地的广播电台邮寄硬盘以收集更多音频数据。为降低成本,他们还建立了一个由在校大学生组成的贡献者网络,负责数据标注和本地人名的发音录制。据该公司透露,目前其系统每天处理的通话量已超过1.7万次。
在商业层面,公司对初次接触语音AI的客户给予充分引导,提供现场演示和工作坊,帮助他们找出最适合自动化的使用场景。
"我们始终告诉客户,我们现在无法满足所有人的一切需求,我们还是一家小公司。在和一家企业开始合作时,我们会请他们先选出一个对他们最重要的使用场景作为起点。"CEO Diallo说道。
目前,AethexAI对各行业保持开放态度,但其主要落地场景集中在催收电话、客户激活以及KYC(即"了解你的客户")验证——这是银行和电信运营商普遍采用的标准身份核验流程。公司正以合同制方式招募驻场工程师服务本地市场,并与电信运营商建立渠道合作,为语音AI通话提供电话接入服务。他们表示,即插即用的通用方案在这里根本行不通。
4DX Ventures联合创始人兼管理合伙人Walter Badoo指出,非洲和中东市场与大多数语音AI公司最初面向的市场存在本质差异。
"非洲和中东地区的企业处理的通话量大约是西方同类企业的三倍,因为语音仍是客户互动的主要渠道,"他表示,"现有系统是为西方市场打造的,那些市场具备高端GPU基础设施、标准英语和欧洲语音环境,以及美欧常见的企业工作流。而当企业需要处理方言、语码转换和非正式语言模式,并在现有电话基础设施和实际预算范围内运行时,这些系统就会暴露出真实的缺口。"
换句话说,尽管ElevenLabs、Deepgram、Sierra、Cognigy等公司正在快速进行全球扩张,但它们起步时所面向的市场与它们正在进入的市场,并不总是同一回事。AethexAI这样的初创公司正在押注:专注本地方言的模型、扎根当地的合作网络、为该地区量身构建的基础设施——这些差异化能力代表着一个市场机遇,而那些巨头既没有动力去填补,也没有合适的架构来实现。
Q&A
Q1:AethexAI是什么公司,主要做什么的?
A:AethexAI是一家成立于2024年的语音AI初创公司,专注于为非洲和中东市场提供本地化语音AI解决方案。区别于其他语音AI公司,AethexAI从零自研了小型模型和编排层,专门处理英语、法语和阿拉伯语的本地方言,目标是解决该地区呼叫中心面临的高延迟、低准确率等问题,目前每天处理通话量超过1.7万次。
Q2:AethexAI的Kora系列模型和大语言模型有什么区别?
A:Kora系列是AethexAI自主研发的小型语音模型,参数量从3亿到17亿不等,远小于通常数千亿参数规模的大语言模型。选择小模型的核心原因是降低延迟——由于非洲和中东地区网络基础设施有限,使用托管在区域外的大型模型会带来严重的延迟和抖动问题,而小型本地化模型可以在每个环节压缩响应时间,同时维持足够的准确率。
Q3:AethexAI的语音AI主要用在哪些场景?
A:目前AethexAI的主要应用场景集中在三类:催收电话自动化、客户激活触达,以及KYC(了解你的客户)身份核验流程。其客户主要来自银行和电信运营商。公司建议新客户从单一最重要的场景切入,而非一次性铺开所有自动化需求,以确保落地效果。
好文章,需要你的鼓励
今天讲的出海案例是明阳电气,这家输配电设备公司在马来西亚投产首个海外生产基地,并以 250 万林吉特子公司承接本地制造。
研究发现AI推理中显卡内存带宽并非唯一瓶颈:H100仅发挥27%内存带宽,而L4达81%,量化工具选择比显卡升级更关键。
今天讲的出海案例是海亮股份,这家铜管、铜棒和铜箔企业把美国得州基地做到扭亏,并用全球23个生产基地承接AI液冷和高端铜材需求。
塞浦路斯大学研究团队提出拓扑感知时空接力框架,利用车辆行驶的物理规律替代外观识别,实现多无人机协同追踪城市车辆时99.8%的全局身份传递成功率。