ElevenLabs 推出自研语音转文本模型

ElevenLabs是一家刚刚完成1.8亿美元融资的人工智能初创公司，主要以其音频生成能力而闻名。该公司通过推出首个独立的语音转文本模型Scribe，迈出了另一个技术方向。该初创公司估值为33亿美元，已帮助许多其他公司提供语音转文本服务，利用其庞大的声音库。然而，该公司现在希望进入语音检测领域，与Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型竞争。

人工智能初创公司 ElevenLabs 在最近完成 1.8 亿美元大规模融资后，又迈出了新的技术步伐。这家以音频生成技术闻名的公司推出了其首个独立的语音转文本模型 Scribe。

这家估值达 33 亿美元的初创公司此前通过其丰富的声音库为许多公司提供语音转文本服务。如今，公司正寻求进军语音识别领域，与 Gladia、Speechmatics、AssemblyAI、Deepgram 以及 OpenAI 的 Whisper 模型展开竞争。

ElevenLabs 的 Scribe 模型一经推出就支持超过 99 种语言。该公司将其中 25 种语言归类为高精度类别，这些语言的词错率低于 5%。这份名单包括英语 (声称准确率达 97%)、法语、德语、印地语、印尼语、日语、卡纳达语、马拉雅拉姆语、波兰语、葡萄牙语、西班牙语和越南语。其他语言则按照词错率被分为不同等级：高等 (5% 到 10%)、良好 (10% 到 20%) 和中等 (25% 到 50%)。

公司表示，在 FLEURS 和 Common Voice 基准测试中，该模型在多种语言上的表现超过了 Google Gemini 2.0 Flash 和 Whisper Large V3。

去年，ElevenLabs 为其 AI 对话代理平台开发了语音转文本组件。但这是该公司首次发布独立的语音识别模型。在上个月与 TechCrunch 的对话中，CEO Mati Staniszewski 谈到了改进语音识别模型的计划。

"我们希望能更好地理解对话中你所说的内容。我们正在研究如何不仅仅局限于生成内容，而是理解和转录语音，" Staniszewski 当时表示。"很多人说语音转文本是一个已解决的问题。但对于许多语言来说，效果其实很差。我们认为可以开发出更好的语音识别模型，因为我们有内部团队可以标注数据并提供快速反馈。"

该模型还具备智能说话人分离功能，可识别发言者身份，支持词级时间戳以实现精确字幕，并能自动标注笑声等声音事件。该公司在其工作室中提供了直接转录视频内容并添加字幕的功能。

Scribe 目前仅支持预录制的音频格式。公司表示将很快推出低延迟的实时版本模型。这意味着目前该模型还不适用于会议记录或语音笔记等场景。

ElevenLabs 为 Scribe 定价为每小时音频转录 0.40 美元。虽然这个价格具有竞争力，但其部分竞争对手目前提供更低的音频转录价格，同时在功能上有所差异。

来源：Techcrunch

0赞

好文章，需要你的鼓励

ElevenLabs 推出自研语音转文本模型

来源：Techcrunch

2025

02/28

09:51

分享

点赞

通用汽车2028年推出解放双眼双手自动驾驶系统

谷歌量子芯片实现分子形状可验证量子模拟

卡耐基梅隆团队声称基于向量的系统可大幅提升PostgreSQL性能

MLPerf基准测试如何指导数据中心设计决策

Linux内核新补丁支持休眠过程中途取消操作

亚马逊AI机器人与智能眼镜助力快递配送升级

MariaDB推出智能体功能并获得分析性能提升

PEAK:AIO押注开放pNFS技术挑战Lustre文件系统

戴尔扩展AI数据平台，新增搜索分析功能

IEEE：为何防钓鱼培训难有成效

Perplexity推出电视应用 率先登陆三星智能电视

M5 MacBook Pro评测：优秀但缺乏新意

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Perplexity推出电视应用率先登陆三星智能电视