OpenAI Group PBC宣布ChatGPT将通过升级变得不再那么令人尴尬和别扭,新的默认体验现在由GPT-5.3-Instant驱动。
该公司在今日的博客文章中宣布了这一新模型更新,表示GPT-5.3-Instant将减少过度谨慎的拒绝回答和不必要的免责声明,提供更准确的回应并减少幻觉现象——在AI术语中称为"过度警告"。这一变化回应了越来越多用户的抱怨,他们认为早期版本的模型在日常互动中听起来过于"死板"和专横。
"这次更新专注于人们每天都能感受到的ChatGPT体验部分:语调、相关性和对话流畅性",OpenAI在博客文章中说道。"这些是细致入微的问题,不总是在基准测试中显现,但会影响ChatGPT给人的感觉是有用还是令人沮丧。GPT-5.3 Instant直接反映了用户在这些方面的反馈。"
OpenAI解释说,早期版本的GPT-5.3经常拒绝回答它本可以且应该回答的问题,无需担心提问者打算如何使用所获得的知识。在其他情况下,当它回答时,会对安全问题进行过长的解释。
公司的测试显示,GPT-5.3 Instant在事实可靠性方面有所改进,回应语调也有变化。当模型使用网络信息时,幻觉现象减少了约27%,仅依赖训练知识时减少了20%。OpenAI虽然没有定义"尴尬"的具体含义,但表示该模型现在具有更强的写作能力,特别是在创作诗歌等创意材料方面。
该公司表示,从今日起GPT-5.3 Instant将取代GPT-5.2 Instant成为ChatGPT的默认模型,但后者仍将在传统选项中向付费用户提供。
社交媒体上对新模型的反应不一。虽然一些人支持更直接的回应和减少不必要的免责声明,但另一些人批评OpenAI最近决定与美国国防部签署合同,而其竞争对手Anthropic PBC出于道德考虑拒绝了这样做。还有人说GPT-5.3 Instant仍然无法匹配现已弃用的GPT-4o模型的亲密感,再次呼吁恢复那个极受欢迎的模型。
Q&A
Q1:GPT-5.3 Instant相比之前的版本有什么改进?
A:GPT-5.3 Instant减少了过度谨慎的拒绝回答和不必要的免责声明,提供更准确的回应。幻觉现象在使用网络信息时减少了约27%,仅依赖训练知识时减少了20%。同时在语调、相关性和对话流畅性方面都有改善,写作能力特别是创意材料方面也更强了。
Q2:为什么用户觉得之前的ChatGPT版本"尴尬"?
A:早期版本的GPT模型经常过度谨慎,会拒绝回答本可以回答的问题,或者在回答时提供过长的安全解释和免责声明。用户感觉这些回应过于"死板"和专横,在日常互动中显得别扭和令人沮丧。
Q3:GPT-5.3 Instant什么时候开始使用?
A:GPT-5.3 Instant从今日起将取代GPT-5.2 Instant成为ChatGPT的默认模型。所有用户都可以体验到新模型,而GPT-5.2 Instant仍将在传统选项中向付费用户提供。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。