谷歌Gemini 3.1 Flash TTS模型：带来对AI语音前所未有的精细控制

谷歌DeepMind推出全新文字转语音模型Gemini 3.1 Flash TTS，用户可通过文字指令控制语音风格、语调和语速。该模型支持多种情感模式（如"热情""惊喜"）、多地区口音（含美式、英式等多种变体），并提供播客、有声书、语音助手等格式模板。用户还可自定义对话场景，并将配置导出为API代码，实现高度灵活的语音定制体验。

谷歌旗下DeepMind人工智能部门近日正式推出了一款全新的文本转语音模型——Gemini 3.1 Flash TTS。

与以往机械生硬的同类产品不同，该模型允许用户通过文字指令来控制语音风格、表达方式以及语速节奏。谷歌在其官方博客中介绍，X平台上发布的演示视频清晰展示了Gemini 3.1 Flash TTS在语音控制方面的强大能力，用户可以灵活调整模型的语气和音调。可供选择的风格选项包括"热情洋溢"、"惊喜愉悦"以及"信息传递"等多种模式。

除此之外，该模型还支持多种主流语言的地区口音选择。仅英语一项便提供了丰富的方言版本，涵盖美式"加州谷"口音、"南方"口音，以及多种英式变体，如"布里克斯顿"口音和"标准英式"发音，此外还有"跨大西洋"口音等更多选择。

Gemini 3.1 Flash TTS还配备了导演级别的精细控制功能，允许用户对模型的说话风格和语速进行深度调整。与此同时，该模型还内置了多种格式模板，包括播客对话、有声书旁白、语言教学辅导、语音助手、健康养生指导、新闻播报以及客服支持等场景风格。谷歌表示，用户可以通过定义使用环境并提供具体的对话指令来"设置舞台"，并且支持将这些配置导出为API代码，方便开发者进行集成与二次开发。

Q&A

Q1：Gemini 3.1 Flash TTS和普通语音模型有什么区别？

A：Gemini 3.1 Flash TTS最大的不同在于它提供了极为精细的语音控制能力。用户可以通过文字指令直接调整语音的风格、表达方式和语速，还能选择"热情洋溢""惊喜愉悦"等具体情绪风格，而传统语音模型大多只能输出单一、机械的声音，灵活性远不及此。

Q2：Gemini 3.1 Flash TTS支持哪些语言和口音？

A：目前该模型支持多种主流语言的地区口音选择。以英语为例，可选口音非常丰富，包括美式"加州谷"口音、"南方"口音，以及英式"布里克斯顿"口音、"标准英式"发音，还有"跨大西洋"口音等多种变体，充分满足不同场景的语音需求。

Q3：Gemini 3.1 Flash TTS有哪些实际应用场景？

A：该模型内置了多种实用场景模板，包括播客对话、有声书旁白、语言教学辅导、语音助手、健康养生指导、新闻播报和客服支持等。用户可以直接套用模板，也可以自定义环境设置和对话指令，并将配置导出为API代码，适合开发者进行应用集成。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

谷歌Gemini 3.1 Flash TTS模型：带来对AI语音前所未有的精细控制

来源：SiliconANGLE

2026

04/16

09:48

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

苹果计划送Siri工程师参加AI编程训练营

我如何用AI追赶流行文化潮流

Meta与博通深化定制AI芯片合作，部署规模达数吉瓦

内存芯片短缺持续发酵，微软Surface全线涨价

AI驱动大型机迁移泡沫即将破裂，Gartner发出预警

Visual Studio Code 1.115 正式推出 VS Code 智能体应用

DARPA启动MATHBAC项目：用数学语言打通AI智能体间的通信壁垒

SMRT借助AI与数据分析技术预测轨道故障并提升维护效率

数据中心为何开始自建发电设施

Waymo自动驾驶汽车进军伦敦，迎接最严峻挑战

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会