今天凌晨,OpenAI宣布本周内,向所有ChatGPT Plus和Team用户开放高级语音模式。
除了最初功能之外,OpenAI还新增了自定义指令、语音记忆存储、5种新声音、语速以及新增了50多种语音(最初是40种),同时支持中文模式。
怪不得昨天Sam Altman那么兴奋长文介绍智能时代的降临,原来憋了那么久的大招高级语音终于发布了。

如果你是ChatGPT付费用户,会收到一封开启高级语音模式的信。可以使用自然语音与ChatGPT交互,例如,帮我看看上海有哪些三星米其林餐厅;
国庆节我想去杭州旅游7天,你有哪些好的建议;或者去国外旅游时做同声翻译。在整个交流过程中是可以随时打断它的,就像朋友之间聊天一样。

OpenAI还特意用中文秀了一段最新的高级语音模式。
下面「AIGC开放社区」根据OpenAI发布的产品视频,为大家解读最新功能。
新增了5个声音模式,可以选择不同的声音来与你交互,包括冷静、热情、才艺、开朗等不同风格,来满足不同的场景。
例如,你希望让ChatGPT帮助你提升唱歌的水平,便可以选择才艺模式。
新增的高级语音自定义指令功能,可以进行更详细的功能设置。例如,你可以设置ChatGPT的语音模式如何输出,是快速一点还是慢一点,或者让AI如何称呼你。
基本上第一次使用都会有引导来帮助你完成所有设置,这个对于特定业务场景的用户帮助很大。
优化了语音的流畅度、对话速度和口音,在不同的业务场景ChatGPT的语音输出也会随着变化。例如,你希望它帮助你演示一个面试的场景,整个对话速度会快一些并且很严肃。
如果你希望让ChatGPT用语音帮你讲童话故事,那么语音就会变的很轻松慢一些。这个新增功能还是相当人性化的,同时进一步增强拟人化的语音。
所以,相比ChatGPT单纯的文本功能,语音模式可以进一步扩大其应用场景,尤其是在移动端玩法就变的多了。
例如,教育领域可以使用ChatGPT语音模式来帮助学生练习口语,不仅能够获得即时的反馈,还能在模仿和纠正发音的过程中,感受到与真人交流的感觉;
律师可以使用语音模式,来模拟法庭上的辩论场景,降低自己的临场压力;商务人员可以使用它模拟商业谈判,应对不同的突发事件;医疗可以打造医护助手,及时提醒病人吃药跟踪治疗等。
基本上,ChatGPT的高级语音模式符合Sam Altman描绘的智能时代特征,相信经过多个版本的迭代会向超级智能迈进。
不少网友看到语音模式终于发布了,那是相当的感慨。不过缺了Her的声音,还是不太完美。
(当初是有电影《Her》女主角的声音,这也是ChatGPT语音模式的大卖点。后来因为斯嘉丽起诉OpenAI就把这个语音模式取消了)

在你发布这些内容的时候,我已经完成了语音模式的最新功能设置。OpenAI终于兑现了他的承诺。

我使用语音模式和我的狗狗聊天,它真的做到了,相当有趣

非常棒的功能!现在ChatGPT不仅能用文本回复我们,还能用语音模式。我可以用语音来写小说或者个人传记啦。

新增的自定义指令和语音记忆功能,相当哇塞~

好文章,需要你的鼓励
今天讲的出海案例是明阳电气,这家输配电设备公司在马来西亚投产首个海外生产基地,并以 250 万林吉特子公司承接本地制造。
研究揭示AI搜索代理"屏蔽旧观测"策略的效果取决于检索质量与模型能力的匹配程度,存在三种截然不同的效果区间。
数学界发布《莱顿宣言》,由16位研究人员历时8个月起草,已获国际数学联盟背书。宣言指出,AI正威胁数学研究的核心价值:AI生成的错误证明难以识别、论文引用不规范、版权争议频发、科技公司主导研究议题,以及企业借新闻稿抢占话语权等问题日益严峻。宣言呼吁数学家透明披露AI使用情况,建议监管机构保护作者权利并规范AI产业,同时警告各方不要轻信科技公司对AI能力的夸大宣传。
多所高校与研究机构联合构建机器人语义接地测试平台RSB,发现主流VLA模型普遍存在"能抓但抓错"的致命缺陷,语义理解与动作生成之间存在严重断层。