OpenAI 于周一发布了 Advanced Voice Mode(高级语音模式)的更新。这项 AI 语音功能支持在 ChatGPT 中进行实时对话,此次更新使 AI 助手变得更富人情味,并减少了打断用户的频率。
OpenAI 的后训练研究员 Manuka Stratta 在周一发布到公司官方社交媒体渠道的视频中宣布了这些变更。
OpenAI 的最新更新旨在解决 AI 语音助手的一个常见问题:当用户停顿思考或深呼吸时会被打断。
ChatGPT 的免费用户现在可以使用新版本的 Advanced Voice Mode,允许用户在与 AI 助手对话时暂停而不被打断。ChatGPT 的付费用户(包括 OpenAI 的 Plus、Teams、Edu、Business 和 Pro 层级的订阅者)在使用 Advanced Voice Mode 时也将获得更少的打断,同时语音助手的个性也得到了改进。
一位 OpenAI 发言人向 TechCrunch 表示,面向付费用户的新 AI 语音助手"在回答时更直接、更具互动性、更简洁、更具体,也更有创造力。"
Advanced Voice Mode 的这些改进是在来自 AI 语音助手领域竞争对手的巨大压力下进行的。
由 Oculus 联合创始人 Brendan Iribe 创建、获得 Andreessen Horowitz 支持的创业公司 Sesame 最近因其自然音色的 AI 语音助手 Maya 和 Miles 而走红。更大的参与者也在更积极地进入 AI 语音助手领域,比如 Amazon 正在准备发布其由大语言模型驱动的 Alexa 新版本。
好文章,需要你的鼓励
PHP 8.5正式发布,引入了期待已久的管道操作符和符合标准的URI解析器。管道操作符支持函数调用链式操作,让代码更具可读性,避免冗余变量和嵌套语句。新增的URI扩展基于RFC 3986和WHATWG URL标准,为开发者提供标准化的URI解析功能。此外还包括Clone With属性更新、NoDiscard属性警告等特性。
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
SkyReels是专为营销人员、设计师和社交媒体内容创作者打造的多模态生成式AI视频平台。该平台整合了Google Veo 3.1、Sora 2等顶级AI模型,支持文本转图像、图像转视频等多种工作流程。平台特色包括智能创意助手Expert Agent,通过结构化问答指导创作流程,以及150多个针对服装、消费品等领域的专业模板。SkyReels专注于TikTok、Instagram等社交平台的快速内容制作需求。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。