创业公司aiOla推出动态路由技术解决AI语音识别难题

AI初创公司aiOla发布名为QUASAR的"语音智能网关"，通过动态路由技术将音频请求分配给最适合的语音识别模型。该系统能识别说话者口音、音频条件和领域语境，自动选择最佳ASR系统进行转录。内部测试显示，QUASAR在88.8%的通话中成功选择了性能最佳的ASR模型，显著提升了AI与人类对话的准确性，解决了企业语音识别系统的可靠性问题。

人工智能创业公司aiOla表示，他们在开发能够像人类一样理解人类语音的机器方面取得了突破性进展。

该公司今天宣布推出了一款全新的"语音智能网关"，通过动态路由技术将每个音频请求分配给最适合处理的模型，从而提高语音识别的可靠性。

aiOla首次引起关注是在去年，当时该公司推出了Drax，这是一种新型语音AI模型，采用并行流匹配训练技术来增强语音识别能力。该模型通过同时处理整个口语序列来重构带噪声的人类语音，而不是像传统的顺序方法那样一次预测一个Token。这种方法让模型接触到真实的、声学上合理的错误，从而提高了其理解带口音语音和背景噪声的能力。

现在，该公司通过其语音智能网关进一步发展，这款产品被称为"QUASAR"，即"质量加权无监督ASR评估和排序"的缩写。据aiOla介绍，QUASAR能够识别说话者的特征（如口音）以及音频条件和领域语境，然后将音频信号发送到最合适的自动语音识别系统，以实现更高精度的转录。

这是一项强大的功能，因为语音AI模型市场已经变得高度分化，拥有数百个竞争的ASR系统，它们都采用了不同的训练方式。OpenAI的Whisper、亚马逊的Transcribe、阿里巴巴的Qwen2和Deepgram不断通过连续发布新版本来超越彼此，努力根据口音、噪声和语境提高准确性。然而，大多数企业并没有充分利用这些丰富多样的选择，而是简单地采用在基准测试中表现最佳的ASR作为一刀切的解决方案，而不是针对每种场景使用最佳的ASR。

联合创始人兼总裁阿米尔·哈拉马提表示，大多数企业只是简单地接受他们所选择的ASR引擎的盲点。但他认为这是一个糟糕的想法。例如，虽然他们选择的ASR可能在解释美国口音说话者方面表现出色，但在试图理解英式英语说话者时可能就会力不从心。或者，一些ASR在完美条件下工作得很好，但一旦加入背景噪声（如繁忙的机场或质量较差的连接），就无法再理解人们在说什么。

这种不可靠性在许多情况下是不可接受的。例如，客服代理需要理解客户的问题，这样才不会错误地让客户兜圈子。

"QUASAR将语音识别视为一个动态问题，最佳选择可以根据实际条件（而非平均值）在不同交互间发生变化，"哈拉马提说道。"这对行业来说是一个重大飞跃，可能会对ASR的使用方式造成巨大颠覆。"

该创业公司表示，他们已经在涵盖清晰朗读语音、各种口音、专业演讲、机构音频和金融领域重度内容的多样化基准测试中进行了广泛的内部评估。在这些测试中，QUASAR能够在88.8%的通话中选择表现最佳的ASR，从而实现智能体与人类之间更准确的自动对话。

哈拉马提表示，QUASAR是一个重要的发展，因为语音正快速成为人类与AI模型交互的默认方式。组织根本无法容忍有缺陷的语音识别系统，但没有单一的、全能的ASR能够在每种场景下完美理解语音。

"ASR必须作为活跃的基础设施发挥作用，QUASAR通过在规模化运营语音识别、改善不同人群和环境间的一致性来实现这一愿景，"他说道。"结果是一个能够改变整个语音生态系统的平台，从构建字幕工具的个人开发者到每年处理数十亿分钟音频的全球联络中心。"

Q&A

Q1：QUASAR语音智能网关是什么？它有什么特殊功能？

A：QUASAR是aiOla公司开发的"语音智能网关"，全称为"质量加权无监督ASR评估和排序"。它能够识别说话者的特征（如口音）以及音频条件和领域语境，然后将音频信号动态路由到最合适的自动语音识别系统进行转录，从而大幅提高语音识别的准确性。

Q2：为什么需要动态路由技术来解决语音识别问题？

A：目前语音AI模型市场高度分化，拥有数百个不同的ASR系统，各有优劣。大多数企业只是选择一个在基准测试中表现最佳的ASR作为通用解决方案，但这种"一刀切"的方法无法应对不同口音、噪声环境和语境的挑战。动态路由技术可以根据实际条件选择最适合的ASR，提高整体识别准确性。

Q3：QUASAR技术的实际效果如何？在什么场景下最有用？

A：根据aiOla的内部评估，QUASAR在88.8%的通话中能够选择表现最佳的ASR，显著提高了智能体与人类之间的自动对话准确性。该技术特别适用于客服中心、字幕制作工具等需要处理大量多样化语音内容的场景，尤其是在面对不同口音、背景噪声或特定领域术语时表现出色。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

创业公司aiOla推出动态路由技术解决AI语音识别难题

来源：SiliconANGLE

2026

02/10

09:08

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

欧盟威胁对Meta封锁WhatsApp竞争智能体采取行动

苹果新研究：设计师亲自训练AI生成更优质界面

Atlassian承诺在添加AI功能时控制成本并保持利润率

亚马逊AI产能建设速度跟不上需求，再投2000亿美元

Sapiom获得1500万美元融资助力智能体自主购买技术工具

纽约州考虑推出两项法案以规范AI产业发展

CoreWeave推出真实环境测试实验室验证AI生产就绪性

16个Claude智能体协作开发全新C编译器

Anthropic最强Claude AI模型再次升级，编程能力显著增强

Crypto.com创始人收购AI.com域名并投放超级碗广告

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会