Cohere发布首个开源语音转录模型Transcribe

企业AI公司Cohere推出首个语音模型Transcribe，这是一款专为转录设计的开源自动语音识别模型，可用于笔记记录和语音分析。该模型参数量仅20亿，适合消费级GPU自主部署，目前支持14种语言。在Hugging Face开放ASR排行榜上表现优异，平均词错率为5.42%。Cohere计划将其集成到企业智能体编排平台North中，并通过API免费提供服务。

企业AI公司Cohere周四发布了其首个语音模型：Transcribe是一个开源自动语音识别模型，可用于笔记记录和语音分析等任务。

该模型参数量仅为20亿，相对轻量，专为希望自托管的用户设计，可在消费级GPU上运行。目前支持14种语言：英语、法语、德语、意大利语、西班牙语、葡萄牙语、希腊语、荷兰语、波兰语、中文、日语、韩语、越南语和阿拉伯语。

Cohere表示，Transcribe在Hugging Face开放ASR排行榜上击败了Zoom Scribe v1、IBM Granite 4.0 1B、ElevenLabs Scribe v2和Qwen3-ASR-1.7B Speech等模型，平均词错误率达到5.42，低于基准测试中的任何其他模型。

该公司声称，当人工评估员对转录准确性、连贯性和可用性进行评估时，Transcribe相比其他模型的平均胜率达到61%。不过，该模型在转录葡萄牙语、德语和西班牙语时表现不如竞争对手。

Cohere表示，Transcribe可以在一分钟内处理525分钟的音频，这在同类模型中表现优异。

该公司计划将Transcribe集成到其企业智能体编排平台North中，并通过API免费提供该模型。该模型还将在Cohere的托管推理平台Model Vault上提供。

随着对Granola和Wispr Flow等笔记记录和听写应用需求的增长，语音识别模型越来越受欢迎。

今年早些时候，据报道Cohere告诉投资者，其2025年年度经常性收入为2.4亿美元，其首席执行官Aidan Gomez被引述称，这家初创公司可能"很快"上市。

Q&A

Q1：Transcribe语音模型有什么特点？

A：Transcribe是Cohere推出的开源自动语音识别模型，参数量仅20亿，可在消费级GPU上运行。支持14种语言，在Hugging Face开放ASR排行榜上表现优异，平均词错误率仅5.42，可在一分钟内处理525分钟音频。

Q2：Transcribe在性能测试中表现如何？

A：Transcribe在多项测试中表现出色，击败了Zoom Scribe v1、IBM Granite等竞争模型，人工评估显示其胜率达61%。不过在转录葡萄牙语、德语和西班牙语时表现相对较弱。

Q3：如何获得和使用Transcribe模型？

A：Transcribe可通过Cohere的API免费获取，也将在该公司的托管推理平台Model Vault上提供。Cohere还计划将其集成到企业智能体编排平台North中，方便企业用户使用。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Cohere发布首个开源语音转录模型Transcribe

来源：Techcrunch

2026

03/27

10:24

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

智能体机器人与虚假身份引发全球欺诈激增

AI推理成为全球数据中心基础设施的下一轮压力测试

AI错误报告一夜间从垃圾变为有效，Linux内核维护者称

OpenAI无限期搁置ChatGPT成人聊天模式

NotebookLM新功能升级：幻灯片修改与更多输出格式支持

数据中心面临系统性安全风险威胁

量子计算机在真实材料科学领域取得突破性进展

AI模型可高精度预测肝癌风险

Bland创始人分享超高速增长阶段的招聘策略

语音AI初创公司Bland的超高速增长招聘策略

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会