OpenAI API新增多项语音智能功能，助力开发者构建对话应用

OpenAI宣布在其API中推出多项语音智能新功能，助力开发者构建能与用户对话、转录及翻译的应用。新功能包括：基于GPT-5级推理能力的GPT-Realtime-2语音模型、支持70种输入语言和13种输出语言的实时翻译工具GPT-Realtime-Translate，以及实时语音转文字工具GPT-Realtime-Whisper。OpenAI表示已内置安全机制，防止功能被滥用于垃圾信息或欺诈行为。

OpenAI于周四宣布，其API将新增多项语音智能功能，旨在帮助开发者构建能够与用户进行语音对话、转录及翻译的应用程序。

全新语音模型GPT-Realtime-2

OpenAI推出的全新语音模型GPT-Realtime-2，能够生成逼真的语音模拟效果，与用户进行自然对话。与前代产品GPT-Realtime-1.5不同，该模型搭载了GPT-5级别的推理能力，专为处理用户提出的更复杂请求而设计。

实时翻译功能GPT-Realtime-Translate

与此同时，OpenAI还推出了GPT-Realtime-Translate，顾名思义，该功能旨在提供能够与用户"保持同步"的实时对话翻译服务。该功能支持超过70种输入语言（即可识别理解的语言）以及13种输出语言（即向用户传达内容所使用的语言）。

实时转录功能GPT-Realtime-Whisper

此外，OpenAI还发布了全新转录功能GPT-Realtime-Whisper，为用户提供实时语音转文字能力，可在对话进行的同时即时捕获内容。

OpenAI对此表示："我们此次推出的这些模型，将实时音频从简单的问答式交互推向了真正能够完成实际工作的语音界面——在对话展开的过程中，系统能够聆听、推理、翻译、转录并采取相应行动。"

应用场景与潜在价值

这些功能的更新将惠及哪些群体？希望提升客服能力的企业是最显而易见的受益方。不过，OpenAI同时指出，这些新功能将在教育、媒体、活动策划、内容创作者平台等众多领域发挥重要作用。

安全机制与滥用防范

尽管这些工具从企业应用角度来看极具价值，但潜在的滥用风险同样不容忽视。对此，OpenAI表示已内置安全防护机制，以防止新功能被用于制造垃圾信息、欺诈或其他形式的网络滥用行为。系统中设有特定触发机制，"一旦检测到对话内容违反有害内容准则，即可立即终止对话"。

定价方式

所有新增语音模型均已纳入OpenAI的Realtime API。其中，Translate和Whisper按分钟计费，而GPT-Realtime-2则按Token消耗量计费。

Q&A

Q1：GPT-Realtime-2与GPT-Realtime-1.5相比有哪些改进？

A：GPT-Realtime-2在前代产品的基础上进行了重大升级，核心改进在于搭载了GPT-5级别的推理能力。这意味着新模型不仅能够生成更逼真的语音模拟效果，还能处理用户提出的更为复杂的请求，而不仅仅局限于简单的问答式交互，真正实现了在对话过程中的聆听、推理与行动能力。

Q2：GPT-Realtime-Translate支持哪些语言？

A：GPT-Realtime-Translate支持超过70种输入语言，即系统可以识别和理解的语言；同时支持13种输出语言，即系统向用户传达内容时所使用的语言。该功能旨在提供与用户对话节奏保持同步的实时翻译服务，适用于教育、媒体、活动策划等多种场景。

Q3：OpenAI如何防止这些语音功能被滥用？

A：OpenAI已在系统中内置了专门的安全防护机制与特定触发条件。一旦系统检测到对话内容违反有害内容准则，即可自动终止对话。这些措施旨在防止相关功能被用于制造垃圾信息、实施欺诈或从事其他形式的网络滥用行为，从而保障功能在合法合规的场景下使用。

来源：Techcrunch

0赞

好文章，需要你的鼓励

OpenAI API新增多项语音智能功能，助力开发者构建对话应用

来源：Techcrunch

2026

05/13

17:21

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

Gmail新增AI收件箱至底部导航栏，"帮我写作"功能迎来个性化升级

数据主权成为海湾合作委员会AI竞争新战场

Ramp估值洽谈突破400亿美元，距上轮融资仅半年

Spotify AI DJ功能扩展至75余国并新增四种语言支持

AI越狱者究竟在做什么？他们如何突破大语言模型的安全边界

人类的独特性：AI崛起之下，欧洲译者的未来何去何从

AI数据中心建设热潮：从选址策略到轨道数据中心的未来畅想

科技巨头Q1财报出炉：资本支出持续高位，AI基础设施投入超6000亿美元

德克萨斯州AI数据中心崛起：能源与边缘推理的双重挑战

数据中心建设持续高速增长，AI工作负载推动全球扩容

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: