ElevenLabs 推出自研语音转文本模型

ElevenLabs是一家刚刚完成1.8亿美元融资的人工智能初创公司，主要以其音频生成能力而闻名。该公司通过推出首个独立的语音转文本模型Scribe，迈出了另一个技术方向。该初创公司估值为33亿美元，已帮助许多其他公司提供语音转文本服务，利用其庞大的声音库。然而，该公司现在希望进入语音检测领域，与Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型竞争。

人工智能初创公司 ElevenLabs 在最近完成 1.8 亿美元大规模融资后，又迈出了新的技术步伐。这家以音频生成技术闻名的公司推出了其首个独立的语音转文本模型 Scribe。

这家估值达 33 亿美元的初创公司此前通过其丰富的声音库为许多公司提供语音转文本服务。如今，公司正寻求进军语音识别领域，与 Gladia、Speechmatics、AssemblyAI、Deepgram 以及 OpenAI 的 Whisper 模型展开竞争。

ElevenLabs 的 Scribe 模型一经推出就支持超过 99 种语言。该公司将其中 25 种语言归类为高精度类别，这些语言的词错率低于 5%。这份名单包括英语 (声称准确率达 97%)、法语、德语、印地语、印尼语、日语、卡纳达语、马拉雅拉姆语、波兰语、葡萄牙语、西班牙语和越南语。其他语言则按照词错率被分为不同等级：高等 (5% 到 10%)、良好 (10% 到 20%) 和中等 (25% 到 50%)。

公司表示，在 FLEURS 和 Common Voice 基准测试中，该模型在多种语言上的表现超过了 Google Gemini 2.0 Flash 和 Whisper Large V3。

去年，ElevenLabs 为其 AI 对话代理平台开发了语音转文本组件。但这是该公司首次发布独立的语音识别模型。在上个月与 TechCrunch 的对话中，CEO Mati Staniszewski 谈到了改进语音识别模型的计划。

"我们希望能更好地理解对话中你所说的内容。我们正在研究如何不仅仅局限于生成内容，而是理解和转录语音，" Staniszewski 当时表示。"很多人说语音转文本是一个已解决的问题。但对于许多语言来说，效果其实很差。我们认为可以开发出更好的语音识别模型，因为我们有内部团队可以标注数据并提供快速反馈。"

该模型还具备智能说话人分离功能，可识别发言者身份，支持词级时间戳以实现精确字幕，并能自动标注笑声等声音事件。该公司在其工作室中提供了直接转录视频内容并添加字幕的功能。

Scribe 目前仅支持预录制的音频格式。公司表示将很快推出低延迟的实时版本模型。这意味着目前该模型还不适用于会议记录或语音笔记等场景。

ElevenLabs 为 Scribe 定价为每小时音频转录 0.40 美元。虽然这个价格具有竞争力，但其部分竞争对手目前提供更低的音频转录价格，同时在功能上有所差异。

来源：Techcrunch

0赞

好文章，需要你的鼓励

ElevenLabs 推出自研语音转文本模型

来源：Techcrunch

2025

02/28

09:51

分享

点赞

美国NRC提出核废料处置新规，为长期搁置问题开辟出路

OpenClaw 智能体正式登陆 iOS 与 Android 平台

智引芯程，定义未来：德州仪器亮相 2026 慕尼黑上海电子展

“借道”MoP封装，AMD打破“存储墙”与“空间锁”

优必选万台超仿生人形机器人，要在今年进家庭？

Albertsons借助Databricks构建零售商品智能决策平台

微软正式将 Windows 11 打造为 AI 操作系统

工作中使用未授权AI工具之前，请三思

全球首座AI博物馆Dataland：用数据创造多感官视觉盛宴

ANS框架：Linux基金会为AI智能体建立DNS式信任机制

Origin PC Millennium台式机评测：构建出色但配置并非最优选择

Hirebotics推出无代码防爆协作机器人，专为工业喷涂设计

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

《AI启示录》新华三《数字化领航》AI系列专刊

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: