OpenAI Group PBC宣布ChatGPT将通过升级变得不再那么令人尴尬和别扭,新的默认体验现在由GPT-5.3-Instant驱动。
该公司在今日的博客文章中宣布了这一新模型更新,表示GPT-5.3-Instant将减少过度谨慎的拒绝回答和不必要的免责声明,提供更准确的回应并减少幻觉现象——在AI术语中称为"过度警告"。这一变化回应了越来越多用户的抱怨,他们认为早期版本的模型在日常互动中听起来过于"死板"和专横。
"这次更新专注于人们每天都能感受到的ChatGPT体验部分:语调、相关性和对话流畅性",OpenAI在博客文章中说道。"这些是细致入微的问题,不总是在基准测试中显现,但会影响ChatGPT给人的感觉是有用还是令人沮丧。GPT-5.3 Instant直接反映了用户在这些方面的反馈。"
OpenAI解释说,早期版本的GPT-5.3经常拒绝回答它本可以且应该回答的问题,无需担心提问者打算如何使用所获得的知识。在其他情况下,当它回答时,会对安全问题进行过长的解释。
公司的测试显示,GPT-5.3 Instant在事实可靠性方面有所改进,回应语调也有变化。当模型使用网络信息时,幻觉现象减少了约27%,仅依赖训练知识时减少了20%。OpenAI虽然没有定义"尴尬"的具体含义,但表示该模型现在具有更强的写作能力,特别是在创作诗歌等创意材料方面。
该公司表示,从今日起GPT-5.3 Instant将取代GPT-5.2 Instant成为ChatGPT的默认模型,但后者仍将在传统选项中向付费用户提供。
社交媒体上对新模型的反应不一。虽然一些人支持更直接的回应和减少不必要的免责声明,但另一些人批评OpenAI最近决定与美国国防部签署合同,而其竞争对手Anthropic PBC出于道德考虑拒绝了这样做。还有人说GPT-5.3 Instant仍然无法匹配现已弃用的GPT-4o模型的亲密感,再次呼吁恢复那个极受欢迎的模型。
Q&A
Q1:GPT-5.3 Instant相比之前的版本有什么改进?
A:GPT-5.3 Instant减少了过度谨慎的拒绝回答和不必要的免责声明,提供更准确的回应。幻觉现象在使用网络信息时减少了约27%,仅依赖训练知识时减少了20%。同时在语调、相关性和对话流畅性方面都有改善,写作能力特别是创意材料方面也更强了。
Q2:为什么用户觉得之前的ChatGPT版本"尴尬"?
A:早期版本的GPT模型经常过度谨慎,会拒绝回答本可以回答的问题,或者在回答时提供过长的安全解释和免责声明。用户感觉这些回应过于"死板"和专横,在日常互动中显得别扭和令人沮丧。
Q3:GPT-5.3 Instant什么时候开始使用?
A:GPT-5.3 Instant从今日起将取代GPT-5.2 Instant成为ChatGPT的默认模型。所有用户都可以体验到新模型,而GPT-5.2 Instant仍将在传统选项中向付费用户提供。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。