Azure AI Speech升级：仅需几秒音频即可生成逼真语音克隆

微软升级了Azure AI Speech服务，用户仅需几秒钟的语音样本即可快速生成逼真的语音复制品。该个人语音功能于2024年5月21日正式发布，采用名为"DragonV2.1Neural"的零样本文本转语音模型，支持100多种语言。微软表示新版本在语音自然度、韵律稳定性和发音准确性方面都有显著提升，可用于定制聊天机器人语音、视频配音等应用。尽管微软要求用户遵守使用政策并获得原说话者同意，但该技术仍可能被恶意使用。

微软已升级Azure AI Speech服务，用户现在只需几秒钟的音频样本就能快速生成令人信服的语音复制品。

个人语音功能于2024年5月21日正式发布。虽然之前版本已经相当出色，但需要一定的训练才能获得最佳效果。据微软介绍，该功能已升级为名为"DragonV2.1Neural"的全新零样本文本转语音模型，能够生成"更自然、更富表现力的语音"，并支持100多种语言的音频生成。

微软表示，与之前的模型相比，此次升级"在语音自然度方面带来了显著改进，提供更真实稳定的韵律，同时保持更好的发音准确性"。

这一原本就相当出色的系统现在变得更加准确，令人担忧。微软称："这项能力开启了广泛的应用场景，从定制聊天机器人语音到用演员原声为视频内容进行多语言配音，实现真正沉浸式的个性化音频体验。"

然而，这项技术也可能被恶意或欺骗性目的所利用，我们可以想象使用该服务制作的音频深度伪造内容将变得越来越难以识别。

但不必担心——除了添加水印以便更容易识别生成的音频（尽管人耳无法听出），微软坚持表示"所有客户都必须同意我们的使用政策，包括要求获得原始说话者的明确同意、披露所创建内容的合成性质，以及禁止冒充任何人或使用个人语音服务欺骗他人"。

微软并非首家提供仅需几秒音频即可克隆用户语音服务的公司。今年早些时候，总部位于帕洛阿尔托的AI初创公司Zyphra推出了一对开源文本转语音模型，声称只需几秒钟的音频样本。在我们的测试中发现，大约需要30秒的语音样本才能创建出令人毛骨悚然的准确效果。

近年来，AI语音克隆已成为一个严重问题，因为技术发展速度超过了安全保障措施。今年3月，《消费者报告》指出四家提供AI语音克隆软件的公司未能提供有意义的安全保障，而FBI也警告称，诈骗者正在使用美国政府高级官员的深度伪造语音进行大规模欺诈活动。

Q&A

Q1：Azure AI Speech的个人语音功能有什么新升级？

A：微软将Azure AI Speech升级为"DragonV2.1Neural"零样本文本转语音模型，只需几秒钟音频样本就能生成更自然、更富表现力的语音复制品，支持100多种语言，在语音自然度、韵律稳定性和发音准确性方面都有显著改进。

Q2：AI语音克隆技术存在哪些安全风险？

A：AI语音克隆可能被用于恶意或欺骗目的，包括制作难以识别的音频深度伪造内容。FBI已经警告诈骗者正在使用深度伪造的政府官员语音进行大规模欺诈活动，这项技术的发展速度已经超过了安全保障措施。

Q3：微软采取了哪些措施来防止AI语音克隆被滥用？

A：微软要求所有客户同意使用政策，包括必须获得原始说话者的明确同意、披露内容的合成性质、禁止冒充他人或欺骗用户。此外，生成的音频还会添加水印以便识别，尽管人耳无法直接听出。

来源：The Register

0赞

好文章，需要你的鼓励

Azure AI Speech升级：仅需几秒音频即可生成逼真语音克隆

来源：The Register

2025

08/01

10:17

分享

点赞

苹果在印度恢复银行卡支付功能，距暂停已逾四年

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Canonical重启TPM加密技术，Ubuntu 25.10版本即将支持

IOWN全光网络项目迎来五周年 与ITU签署合作协议

乐天移动选择思科、诺基亚、F5为5G SA网络合作伙伴

Meta投资千兆瓦数据中心打造"超级智能"实验室

光学基础设施为何成为AI未来发展核心

2026年CIO预算规划：核心投资重点与AI转型策略

AI智能体会颠覆SaaS市场吗？专家意见分歧

思科开源AGNTCY项目推动多智能体系统发展

高通推进数据中心CPU开发，正与头部云服务商洽谈合作

微软第四季度财报超预期 云计算和AI业务成增长引擎

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

IOWN全光网络项目迎来五周年与ITU签署合作协议

微软第四季度财报超预期云计算和AI业务成增长引擎