Krisp推出VIVA开发工具包提升语音智能体精准度

语音AI解决方案提供商Krisp发布了VIVA语音隔离AI模型和软件开发工具包，专为语音AI智能体设计。VIVA每月处理超过10亿分钟的语音音频，能在20毫秒内处理音频，将对话轮转准确性提升3.5倍，减少50%的通话中断。该工具可过滤背景噪音和笑声，避免AI误判，提升转录准确性和用户体验。

语音人工智能解决方案领先供应商Krisp Technologies Inc.今日宣布推出VIVA，这是一个专为语音智能体设计的新型语音隔离AI模型和软件开发工具包。

该公司还透露，VIVA目前每月在全球范围内处理超过10亿分钟的语音音频。

VIVA是"语音智能体语音隔离"的缩写，集成到应用程序的音频路径中。它增强了语音智能体检测语音活动的能力，改善了它们的对话轮换行为，有助于防止错误中断并创造更自然、有效的对话。

消费者对AI语音交互的期望越来越高。过去，与在线系统的对话是僵化和脚本化的，往往只是美化的录音。这些日子即将结束。如今，语音智能体可以进行真实对话，动态响应并适应上下文。

"行业术语称之为对话轮换，"联合创始人兼首席执行官Davit Baghdasaryan在接受SiliconANGLE独家采访时说。"当有背景噪音时，对话轮换就会变得非常混乱——特别是背景声音。AI会变得非常困惑。"

对话轮换指的是对话的来回流动，或者知道何时说话何时倾听。人类通过语言和非语言的调整，如语音、停顿、语调和肢体语言，自然地做到这一点。

在语音AI中，对话轮换指的是检测用户何时停止说话以及何时适合响应而不中断或留下长时间沉默。糟糕的对话轮换会导致尴尬或不自然的交互。

Krisp的VIVA模型在20毫秒内处理音频，显著提高了响应速度。它可以将对话轮换准确性提高3.5倍，从而减少50%的通话中断，并帮助提升客户满意度。

与依赖耗电图形处理器的模型不同，VIVA在中央处理器上高效运行，使其非常适合在广泛的设备上部署。这使其能够嵌入运行或与更大模型并行工作而不影响性能。

这对企业至关重要，因为它即使在嘈杂环境中也能提高转录准确性，并消除不相关的音频，如背景电视或无关对话，改善自动理解和整体用户体验。

人类交流依赖于微妙的音频和行为线索。虽然人们自然地处理这些线索，但语音智能体仍然难以应对。背景声音、笑声甚至停顿都可能导致AI响应中断或混乱。

"仅从音频就有五、六种不同的线索，"Baghdasaryan解释说。"如果我们想要有人类级别的对话AI，AI必须意识到这些线索。"

Krisp设计VIVA来识别和适应这些信号。例如，一个VIVA模型过滤掉笑声——在有儿童的环境中特别有用——这样机器人就不会误解这些声音为用户语音的一部分。

"笑声是一个很大的问题，"Baghdasaryan说。"我们有模型可以去除笑声，这样机器人就不会被它中断。"

VIVA已经集成到Decagon AI、Voxex.ai、Vapi Inc.、Ultravox.ai（前身为Fixie.ai）、LiveKit Inc.和一些世界最大AI实验室使用的智能体系统中，在那里它正在提供可衡量的改进。

"当我们的开发团队演示Krisp的能力时，我们被震撼了，"Vodex首席技术官Kumar Saurav说。"看到我们的机器人即使在嘈杂的办公室噪音中也能不间断地继续工作，对我们来说是一个游戏规则改变者。"

Baghdasaryan总结说，随着每月数十亿音频请求的里程碑，VIVA已准备好让开发者构建更响应迅速的智能体，并为更好的客户支持和虚拟伙伴提供基础。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Krisp推出VIVA开发工具包提升语音智能体精准度

来源：SiliconANGLE

2025

07/17

07:44

分享

点赞

HPE与爱立信联合验证双模5G核心网技术

智能体AI来了，改变生活需要你的信任

谷歌Deepmind利用AI助力聚变反应堆技术突破

Yoshua Bengio领衔：《2026年国际人工智能安全报告：首次关键更新》，不可忽视的AI风险

SAP用户仍在为S/4HANA业务案例苦恼

微软将NASA卫星数据集成至Azure云平台

SAP ECC客户转向可组合ERP以避免昂贵升级

希捷研发基于CXL内存的可组合内存设备

华为ACT路径助力企业大规模AI应用跨行业落地

斯坦福大学利用AI合成数据绘制大脑奥秘

英特尔人工智能全球影响力嘉年华，中国创新力量崭露头角

智算赋能，生态共荣——超智算人工智能产业生态大会在京启幕，共筑AI发展新范式

谷歌研究：大语言模型在压力下会放弃正确答案

OnePlus 13将获得专属AI"心智空间"功能

大型企业AI岗位成IT从业者高薪就业首选

Mistral发布首个开源AI音频模型Voxtral

Google Discover新增AI摘要功能，出版商流量或进一步下滑

Anthropic推出专为金融服务设计的Claude专业版

AI编程工具正向终端转移：生成式AI的新趋势

研究领导者呼吁科技行业监控AI的"思维"过程

Broadcom推出Tomahawk Ultra：以太网能否取代UALink？

自主性、服务区域、通用性 - 真正机器人出租车的核心要素

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: