Google宣布推出Gemini 3.5实时翻译功能，支持即时语音互译

Google正式推出Gemini 3.5 Live Translate，这是一款支持超过70种语言的语音到语音实时翻译模型。该模型能够自动检测语言、匹配语调与语速，延迟仅几秒，翻译效果自然流畅。开发者可通过Gemini Live API或AI Studio提前体验，企业用户将在Google Meet中率先获得访问权限，Google翻译应用也将很快在Android和iOS平台更新。此外，所有音频流均嵌入SynthID水印，标记其为AI生成内容。

谷歌多年来一直致力于实时翻译技术的研发，称其为公司"开创性机器学习实验"之一。我们曾在谷歌的历届发布活动上见到过大量相关演示，但彼时用户必须持有谷歌手机、耳机或其他特定设备才能体验。去年，谷歌已在翻译应用中向更多用户开放了实时翻译功能，如今这一能力再度扩展。随着Gemini 3.5实时翻译功能的推出，用户将能够在更多场景中以更低延迟享受即时翻译体验。

这一全新AI模型隶属于在Google I/O大会上发布的3.5系列。此前，谷歌仅推出了Flash版本，预计Pro版本将在未来几周内正式发布。Gemini 3.5实时翻译是一款语音到语音的模型，经过专项调校，可自动识别并翻译70余种语言。

谷歌表示，Gemini 3.5实时翻译的响应速度足以跟上正常对话节奏，在说话者发言后仅延迟数秒即可完成翻译，同时还能匹配原声的语调、语速和音调。简而言之，输出的声音更像是用户本人在说话，而非冷冰冰的机器音。目前公开的演示视频均在受控环境下录制，效果听起来相当出色。不过，用户很快就可以亲自验证该模型的实际能力。

Gemini 3.5实时翻译正在谷歌生态系统的多个场景中逐步部署。开发者现可通过Gemini Live API或AI Studio的公开预览版开始构建相关应用。该模型支持连续语音处理，并能自动处理多语言输入，开发者无需手动配置相关参数。此外，该模型还具备背景噪声过滤功能，可在嘈杂环境中保持良好的翻译效果。

部分企业客户将于本月起在Google Meet中率先体验这一翻译模型，并将在后续面向更多用户开放。谷歌表示，还将对Meet界面进行调整，使实时翻译功能更加突出易用。值得关注的是，Gemini 3.5实时翻译功能即将登陆Android和iOS平台上的谷歌翻译应用。

去年底，谷歌已开始在翻译应用中测试基于Gemini的实时翻译功能，支持任意品牌耳机（以及iOS应用）；而在此之前，用户必须搭配安卓手机和谷歌自家的Pixel Buds才能使用。即将推出的更新将在此基础上进一步升级，引入最新的3.5模型，不仅支持任意品牌耳机，甚至无需耳机也能使用。在没有耳机的情况下，用户可以像打电话一样将手机举到耳边收听语音翻译。不过，这一"听筒模式"目前仅支持Android设备。

Gemini 3.5实时翻译的音频输出旨在呈现自然逼真的效果，即便无法完全模拟用户本人的声音。然而，谷歌在这方面仍保持审慎态度。所有Gemini 3.5实时翻译的音频流均将在波形数据中嵌入SynthID水印，以标识该语音为AI生成内容，且目前无法去除该水印。

Q&A

Q1：Gemini 3.5实时翻译支持哪些语言？

A：Gemini 3.5实时翻译是一款经过专项调校的语音到语音模型，目前支持自动识别并翻译70余种语言，能够跟上正常对话节奏，并在翻译时匹配原声的语调、语速和音调，使输出声音更加自然。

Q2：Gemini 3.5实时翻译需要搭配特定耳机才能使用吗？

A：不需要。早期谷歌实时翻译功能要求用户使用Pixel Buds配合安卓手机，但随着新版本推出，用户现可使用任意品牌耳机，甚至完全不需要耳机。在没有耳机时，只需像打电话一样将手机举到耳边即可收听语音翻译，但该"听筒模式"目前仅支持Android设备。

Q3：Gemini 3.5实时翻译的音频会不会被误认为是真人声音？

A：谷歌对此保持审慎态度。所有通过Gemini 3.5实时翻译生成的音频流，都会在波形数据中嵌入SynthID水印，明确标识该语音为AI生成内容，且目前没有任何方式可以去除该水印，以防止潜在的滥用风险。

来源：Arstechnica

0赞

好文章，需要你的鼓励

Google宣布推出Gemini 3.5实时翻译功能，支持即时语音互译

来源：Arstechnica

2026

06/10

15:47

分享

点赞

Albertsons借助Databricks构建零售商品智能决策平台

微软正式将 Windows 11 打造为 AI 操作系统

工作中使用未授权AI工具之前，请三思

全球首座AI博物馆Dataland：用数据创造多感官视觉盛宴

ANS框架：Linux基金会为AI智能体建立DNS式信任机制

Hirebotics推出无代码防爆协作机器人，专为工业喷涂设计

美国消费品安全委员会拟出台电动自行车电池安全新规

江波龙：建设完成mSSD月产能百万交付能力！mSSD高速存储介质赋能端侧AI规模应用

从IO500双榜第一，看国产存储的系统级突破

Rocket Lab宣布以80亿美元收购卫星运营商铱星公司

OpenAI携手Trail of Bits发起"Patch the Planet"开源安全修复计划

公共电力性价比优势面临多年来最严峻考验

Runway与Holywater Tech：两家正在颠覆娱乐业的AI公司

Asana推出AI"首席幕僚"功能，助力项目管理高效推进

谷歌宣布夏季免费开放AI搜索视觉功能，并推出2026世界杯Gemini工具

谷歌携手帕里斯·希尔顿，共同展示Android与AI应用构建能力

Claude Mythos 公开亮相，全新Fable 5模型正式发布并"适合大众使用"

Anthropic正式发布面向公众的Mythos级AI模型Claude Fable

iOS 27新增锁屏时钟缩小功能，个性化定制选项再升级

Sharpa将灵巧触觉机器手引入英伟达与宇树人形机器人参考设计

数据中心监管反弹：电网必须加速转型升级

专家视角：谁来负责非结构化数据的安全管理？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: