Groq 和 PlayAI 让 AI 语音更接近人类 — 这是他们的方法

Groq 与 PlayAI 宣布合作，通过 Groq 的高速推理平台推出先进的文本转语音模型 Dialog。这一合作结合了 PlayAI 在语音 AI 方面的专业知识和 Groq 的专业处理基础设施，创造出了据称是目前最自然、响应最快的文本转语音系统之一。该系统不仅支持英语和阿拉伯语，还采用了创新的"自适应语音上下文器"技术，能够实现更自然的对话流。

Groq 和 PlayAI 今天宣布建立合作伙伴关系，通过 Groq 的高速推理平台推出先进的文本转语音模型 Dialog。

这次合作将 PlayAI 在语音 AI 方面的专业知识与 Groq 的专业处理基础设施相结合，据两家公司称，这创造了目前最自然、响应最快的文本转语音系统之一。

"Groq 提供了一个完整的、低延迟的系统，集自动语音识别 (ASR)、生成式 AI 和文本转语音于一体，" Groq 首席营收官 Ian Andrews 在接受 VentureBeat 专访时表示。"随着 Dialog 在 GroqCloud 上运行，这意味着客户无需为单一用例使用多个供应商 — Groq 是一站式解决方案。"

Groq 助力首个阿拉伯语语音 AI，扩大中东科技布局

Dialog 支持英语和阿拉伯语，其中阿拉伯语版本是首个专门为中东地区设计的语音 AI。将阿拉伯语作为初始语言之一是两家公司的战略选择。

"阿拉伯语是全球使用人数第四多的语言 — 通过与 PlayAI 合作提供阿拉伯语 TTS 模型，Groq 正在打开一个关键的全球市场，让更多用户能够访问快速 AI 推理，" Andrews 告诉 VentureBeat。

据第三方评估机构 Podonos 的基准测试显示，用户对 Dialog 的偏好率比 ElevenLabs v2.5 Turbo 高 10:1，比 ElevenLabs Multilingual v2.0 高出 3:1。

创新的"自适应语音情境分析器"改变对话式 AI

Dialog 的与众不同之处在于其处理上下文的复杂方法。该系统不是将每个发声视为独立事件，而是保持对整个对话流程的感知。

"我们构建了一个称为'自适应语音情境分析器' (ASC) 的新型架构，使模型能够使用对话的完整上下文和历史，" PlayAI 联合创始人兼 CEO Mahmoud Felfel 在接受 VentureBeat 采访时表示。"这意味着每个响应不只是独立的输出，它还富含反映对话流程的适当韵律、语气和情感。"

对于希望实施对话式 AI 的企业来说，请求和响应之间的延迟一直是一个持续的挑战。Groq 专门的语言处理单元 (LPU) 在这方面似乎提供了显著优势。

"根据初步内部测试，Groq 在运行 PlayAI 的 Dialog 模型时可以达到每秒 140 个字符，与同一模型在 GPU 上运行的每秒 86 个字符相比有显著提升，" Andrews 解释道。"这意味着 Dialog 生成文本的速度比实时快 10 倍。"

Groq 获得 15 亿美元沙特投资，打造世界级 AI 基础设施

这次合作恰逢 Groq 重要扩张时期，该公司最近获得沙特阿拉伯 15 亿美元的承诺用于建设额外基础设施。该公司在达曼建立了一个数据中心，称其为"该地区最大的推理集群"。

"与 Groq 合作是显而易见的选择，他们是先进 AI 推理基础设施的行业领导者，" Felfel 说。"对于 TTS 和代理来说，低延迟是关键。我们已经针对这些实时应用优化了 Dialog，但与 Groq 合作让我们能够提供市场上延迟最低的语音模型。"

随着企业寻求在保持自然、类人体验的同时实现客户互动自动化，语音 AI 市场迅速增长。应用范围从客户服务和销售自动化到配音和视障人士无障碍功能。

企业应用超越传统客户服务用例

"除了客户服务，其他企业用例包括自动化销售和预约安排、入职培训和个人助理、为现有内容创建配音、将英语音频和视频内容翻译成阿拉伯语、提高视障人士访问网站和静态内容的无障碍性等，" Andrews 说。

对于由中东和北非地区创业者创立的 PlayAI 来说，包含阿拉伯语功能具有特殊意义。

"作为中东北非地区的创始人，我们知道该地区正大力投资 AI 能力和基础设施，这反映在对 Groq 等公司的投资上，同时也体现在世界领先的采用率上，" Felfel 说。"阿拉伯语是一种全球商业语言，也是我们从小说的语言，所以将其作为核心语言之一是自然的选择。"

两家公司已通过 GroqCloud 的分层服务模式提供 Dialog 技术，包括免费和付费选项。这种方式允许开发者在承诺更大规模实施之前先试验该技术。

"GroqCloud 提供免费和付费计划。任何人都可以创建账户并免费获取 API 代码，" Andrews 解释道。"我们的付费开发者层级是自助服务的，意味着任何有信用卡的人都可以自行注册。"

随着语音成为 AI 系统越来越重要的接口，这种合作使两家公司能够把握对更自然、响应更快的对话体验不断增长的需求。通过解决延迟和自然语音模式的技术挑战，Groq 和 PlayAI 可能已经消除了语音 AI 在企业环境中更广泛采用的重要障碍。

来源：VentureBeat

0赞

好文章，需要你的鼓励

Groq 和 PlayAI 让 AI 语音更接近人类 — 这是他们的方法

来源：VentureBeat

2025

03/27

14:59

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

Red Hat 简化 AI 应用训练和推理的数据访问流程

Groq 和 PlayAI 让 AI 语音更接近人类 — 这是他们的方法

OpenAI 爆火的吉卜力风格引发 AI 版权担忧

ETSI 发布首个后量子加密标准

ChatGPT 整合 GPT-4o 推出图像生成功能

让数据为 AI 做好准备的三个步骤

Imandra 新推出的 AI 编程助手 CodeLogician 利用"推理能力"确保代码准确性

微软为研究和数据分析推出"深度推理"版 Copilot AI

Amazon 推出 AI 智能购物助手，洞悉你的喜好

前英特尔 CEO Gelsinger 转投宗教科技公司 Gloo 任要职

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: