Azure AI Speech升级：仅需几秒音频即可生成逼真语音克隆

微软升级了Azure AI Speech服务，用户仅需几秒钟的语音样本即可快速生成逼真的语音复制品。该个人语音功能于2024年5月21日正式发布，采用名为"DragonV2.1Neural"的零样本文本转语音模型，支持100多种语言。微软表示新版本在语音自然度、韵律稳定性和发音准确性方面都有显著提升，可用于定制聊天机器人语音、视频配音等应用。尽管微软要求用户遵守使用政策并获得原说话者同意，但该技术仍可能被恶意使用。

微软已升级Azure AI Speech服务，用户现在只需几秒钟的音频样本就能快速生成令人信服的语音复制品。

个人语音功能于2024年5月21日正式发布。虽然之前版本已经相当出色，但需要一定的训练才能获得最佳效果。据微软介绍，该功能已升级为名为"DragonV2.1Neural"的全新零样本文本转语音模型，能够生成"更自然、更富表现力的语音"，并支持100多种语言的音频生成。

微软表示，与之前的模型相比，此次升级"在语音自然度方面带来了显著改进，提供更真实稳定的韵律，同时保持更好的发音准确性"。

这一原本就相当出色的系统现在变得更加准确，令人担忧。微软称："这项能力开启了广泛的应用场景，从定制聊天机器人语音到用演员原声为视频内容进行多语言配音，实现真正沉浸式的个性化音频体验。"

然而，这项技术也可能被恶意或欺骗性目的所利用，我们可以想象使用该服务制作的音频深度伪造内容将变得越来越难以识别。

但不必担心——除了添加水印以便更容易识别生成的音频（尽管人耳无法听出），微软坚持表示"所有客户都必须同意我们的使用政策，包括要求获得原始说话者的明确同意、披露所创建内容的合成性质，以及禁止冒充任何人或使用个人语音服务欺骗他人"。

微软并非首家提供仅需几秒音频即可克隆用户语音服务的公司。今年早些时候，总部位于帕洛阿尔托的AI初创公司Zyphra推出了一对开源文本转语音模型，声称只需几秒钟的音频样本。在我们的测试中发现，大约需要30秒的语音样本才能创建出令人毛骨悚然的准确效果。

近年来，AI语音克隆已成为一个严重问题，因为技术发展速度超过了安全保障措施。今年3月，《消费者报告》指出四家提供AI语音克隆软件的公司未能提供有意义的安全保障，而FBI也警告称，诈骗者正在使用美国政府高级官员的深度伪造语音进行大规模欺诈活动。

Q&A

Q1：Azure AI Speech的个人语音功能有什么新升级？

A：微软将Azure AI Speech升级为"DragonV2.1Neural"零样本文本转语音模型，只需几秒钟音频样本就能生成更自然、更富表现力的语音复制品，支持100多种语言，在语音自然度、韵律稳定性和发音准确性方面都有显著改进。

Q2：AI语音克隆技术存在哪些安全风险？

A：AI语音克隆可能被用于恶意或欺骗目的，包括制作难以识别的音频深度伪造内容。FBI已经警告诈骗者正在使用深度伪造的政府官员语音进行大规模欺诈活动，这项技术的发展速度已经超过了安全保障措施。

Q3：微软采取了哪些措施来防止AI语音克隆被滥用？

A：微软要求所有客户同意使用政策，包括必须获得原始说话者的明确同意、披露内容的合成性质、禁止冒充他人或欺骗用户。此外，生成的音频还会添加水印以便识别，尽管人耳无法直接听出。

来源：The Register

0赞

好文章，需要你的鼓励

Azure AI Speech升级：仅需几秒音频即可生成逼真语音克隆

来源：The Register

2025

08/01

10:17

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

Canonical重启TPM加密技术，Ubuntu 25.10版本即将支持

IOWN全光网络项目迎来五周年 与ITU签署合作协议

乐天移动选择思科、诺基亚、F5为5G SA网络合作伙伴

Meta投资千兆瓦数据中心打造"超级智能"实验室

光学基础设施为何成为AI未来发展核心

2026年CIO预算规划：核心投资重点与AI转型策略

AI智能体会颠覆SaaS市场吗？专家意见分歧

思科开源AGNTCY项目推动多智能体系统发展

高通推进数据中心CPU开发，正与头部云服务商洽谈合作

微软第四季度财报超预期 云计算和AI业务成增长引擎

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

IOWN全光网络项目迎来五周年与ITU签署合作协议

微软第四季度财报超预期云计算和AI业务成增长引擎