Mistral发布开源语音合成AI模型Voxtral TTS

巴黎AI公司Mistral发布首个文本转语音模型Voxtral TTS，参数量仅40亿，可在消费级设备运行。该模型采用开源架构，支持英法德西等9种语言，仅需3秒音频即可实现声音克隆，能准确表达情感和语调变化。在自然度测试中与ElevenLabs等主流产品相当，为企业本地化语音应用提供了新选择。

总部位于巴黎的Mistral AI公司今日宣布发布其首款文本转语音人工智能模型Voxtral TTS，旨在挑战市场上最知名和最强大的语音模型。

这款新模型非常轻量化，仅有40亿参数，可以在大多数消费级硬件上运行，包括现代笔记本电脑、中端台式机图形处理器，甚至一些高端移动设备在高压缩状态下也能使用。该公司以开放权重的形式发布这款模型，这意味着它是一个开源模型。

Mistral表示，该模型的亮点是对新声音具有很强的适应性，并且新音频的延迟时间极低，能够快速响应。

尽管模型规模较小，但仍能创造出强大的语音效果。该公司表示，它不仅能朗读文本，还能准确解释文本内容，这是任何文本转语音生成的必备条件。它能够产生适合演讲的情感和语调，例如中性、快乐、讽刺等。目标是捕捉人们自然说话的方式。

即使在英语方面，语音功能也包括美式、英式和法式口音。

在与专有大语言模型语音模型的激烈竞争中，Mistral将其与市场领导者ElevenLabs公司进行了比较。对于语音智能体，该公司表示人工评估显示，Voxtral TTS在自然度方面可与ElevenLabs Flash v2.5相比较，并且在更加逼真的交互中与更大的v3模型表现相当。

虽然英语市场相当庞大，但Mistral是一家法国公司，因此Voxtral TTS是一个多语言模型。该公司表示，它在大型语音数据集上进行训练，专为全球应用而构建。它在九种语言中支持最先进的性能：英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。

该模型可以通过仅仅三秒钟的参考音频进行训练，以适应和克隆语音。它不仅能捕捉声音，还能捕捉细微差别，如微妙的口音、语调变化、音调起伏，甚至是说话者节奏和韵律中自然的口语填充词，如"嗯"、"啊"以及其他中断、停顿和重复。

这种高保真度，加上小巧的体积和开放权重，意味着Mistral认为企业公司希望拥有自己的语音模型并在本地系统上运行。它还为未来更强大的文本转语音AI模型奠定了基础，这些模型将提供更多的质感、定制化和功能，Mistral可以为企业环境提供支持。

用户今天就可以在Mistral Studio或Le Chat中开始使用该模型。开放模型可供开发者使用，提供多个参考语音，可以在Creative Commons许可下从Hugging Face下载。

Q&A

Q1：Voxtral TTS有什么特别之处？

A：Voxtral TTS是Mistral公司首款文本转语音AI模型，仅有40亿参数却能产生高质量语音。它支持9种语言，能够准确解释文本并产生适合的情感语调，仅需3秒参考音频就能进行语音克隆，还能捕捉口音、语调和自然的口语习惯。

Q2：这个模型能在什么设备上运行？

A：由于Voxtral TTS只有40亿参数，非常轻量化，可以在大多数消费级硬件上运行，包括现代笔记本电脑、中端台式机显卡，甚至一些高端移动设备在高压缩状态下也能使用。

Q3：Voxtral TTS支持哪些语言？

A：Voxtral TTS支持9种语言的最先进性能，包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。在英语方面还包括美式、英式和法式口音。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Mistral发布开源语音合成AI模型Voxtral TTS

来源：SiliconANGLE

2026

03/27

15:44

分享

点赞

OpenAI在版权诉讼中疑因隐瞒证据遭遇重大危机

外科医生远程操控人形机器人，完成全球首例活猪手术

OpenAI发布ChatGPT Work：AI助手可连续工作数小时

欧盟向Meta施压：关闭自动播放和无限滚动，否则面临巨额罚款

世界模型的潜力与局限：它真的能模拟一切吗？

苹果起诉OpenAI：前员工利用系统漏洞窃取商业机密

如何利用开源AI智能体实现工作流程自动化

Cloudzy 云服务评测：VPS 性能与体验全面解析

这款PCIe插卡内置38核至强处理器与64GB内存，堪称完整服务器

是否该为企业招募数字员工？AI 智能体团队搭建全指南

AI赋能自主机器人：从工厂走向家庭的未来图景

数据中心能源需求威胁特朗普"美国制造"计划

Google与Cohere发布新一代音频AI模型

Anthropic调整Claude使用限制以缓解高峰时段需求压力

苹果将允许第三方AI聊天机器人接入Siri

Google Gemini推出智能体数据迁移功能

JetBrains推出AI智能体管理平台Central

智能经济崛起，伙伴+华为如何抓住行业+AI的时代机遇？

Claude Code和Cowork现可控制用户电脑

AI基础设施瓶颈：Kubernetes已无法满足AI生产需求

Linear引入智能体AI技术宣告问题追踪时代终结

JumpCloud统一IT管理平台助力企业治理影子AI使用

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: