OpenAI计划第一季度推出全新音频生成模型

据报道，OpenAI正在开发一款专为音频生成任务优化的新AI模型，预计3月底前发布。该模型将产生比现有模型更自然的语音，并在与用户实时交互方面表现更佳。新模型基于全新架构，由前Character.AI研究员领导开发。这款音频模型是OpenAI进军消费电子市场更广泛计划的一部分，公司还计划明年推出音频优先个人设备。

据报道，OpenAI集团正在开发一款专门针对音频生成任务优化的全新人工智能模型。

《The Information》今日援引消息人士称，该算法将于3月底前发布。据该出版物报道，预计新模型将产生比OpenAI当前模型更自然的语音效果。该AI还将在处理与用户的实时双向交互方面表现更佳。

据报道，OpenAI将基于全新架构构建该模型。该公司目前的旗舰实时音频模型GPT-realtime采用了广泛使用的Transformer架构。目前尚不清楚该公司是否会转向完全不同的算法设计，还是仅仅采用新的Transformer实现方案。

一些基于Transformer的音频模型直接处理语音。而其他模型，如OpenAI在2022年发布的Whisper算法，会先将音频文件转换为称为频谱图的图形，然后再进行处理。Whisper和该公司较新的音频模型都提供多个版本，输出质量各不相同。OpenAI可能也会为预计本季度发布的算法提供多个版本。

据报道，该公司已将多个工程、产品和研究团队整合，以支持其音频模型推进计划。该项目据称由Kundan Kumar领导，他是风投支持的AI提供商Character.AI公司的前研究员。该初创公司的许多其他员工在2024年底作为27亿美元反向收购的一部分加入了谷歌公司。

OpenAI即将推出的模型可能不会仅专注于语音生成用例。新兴的AI音乐生成领域目前正经历快速增长：《华尔街日报》最近报道称，市场参与者之一、初创公司Suno公司正在产生超过2亿美元的年收入。进入这一领域可能有助于OpenAI提升其消费者业务。

即将推出的音频模型是该公司进入消费电子产品市场更广泛努力的一部分。据《The Information》报道，OpenAI计划在大约一年内推出"音频优先的个人设备"。据信该公司最终可能推出包括智能音箱和智能眼镜在内的完整设备产品组合。

去年5月，OpenAI收购了产品设计初创公司io Products来支持其消费硬件推进计划。该交易对这家由Jony Ive创立的初创公司估值65亿美元。10月，《金融时报》报道称，Ive正在开发一款智能手机大小的设备，设计用于放置在桌子或台面上。

OpenAI可能寻求开发轻量级的设备端音频模型来支持其进入消费硬件的举措。在本地处理提示比将它们发送到云端更具成本效益。谷歌在其Pixel智能手机系列中采用了类似方法，使用名为Gemini Nano的设备端模型来支持某些AI功能。

Q&A

Q1：OpenAI新音频模型有什么特别之处？

A：OpenAI即将推出的新音频模型基于全新架构构建，预计将产生比当前模型更自然的语音效果，并在处理与用户的实时双向交互方面表现更佳。该模型计划于2025年第一季度末发布。

Q2：OpenAI为什么要开发音频模型？

A：这是OpenAI进入消费电子产品市场更广泛战略的一部分。AI音乐生成领域正快速增长，加入这一领域可能帮助提升消费者业务。同时为支持计划中的"音频优先个人设备"和智能硬件产品组合。

Q3：OpenAI在消费硬件方面有什么计划？

A：OpenAI计划在大约一年内推出"音频优先的个人设备"，最终可能推出包括智能音箱和智能眼镜的完整设备组合。公司已收购Jony Ive创立的产品设计公司io Products来支持硬件推进计划。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

OpenAI计划第一季度推出全新音频生成模型

来源：SiliconANGLE

2026

01/05

14:17

分享

点赞

Uber年度遗失物报告揭示：数千件物品遗留在无人驾驶出租车中

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

特斯拉在奥斯汀开始测试无方向盘无踏板Cybercab量产版

图灵奖得主Patterson：摩尔定律的真相，CPU、GPU、TPU的诞生与分工

Omdia报告：Dell PowerProtect助力企业三年期网络弹性TCO最高降低61%

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

Instagram负责人：AI内容泛滥，为真实媒体加指纹比识别虚假内容更实用

大学辍学成为初创企业创始人最抢手标签

SwitchBot推出AI录音器AI MindClip，打造个人记忆第二大脑

Plaud推出新款AI可穿戴设备，有望取代Otter.ai

Instagram负责人：你的眼睛已经不能分辨什么是真实的了

派拓网络安全官：智能体将成2026年最大内部威胁

Subtle发布搭载降噪模型的无线耳机

纳瓦尔Flow 2扫地机器人问世：配备AI识别技术能找到丢失物品

7个家庭AI技巧让智能聊天机器人相形见绌

OpenAI重组团队开发语音AI硬件产品，2026年推出新模型

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: