OpenAI宣称ChatGPT新默认模型幻觉现象大幅减少

OpenAI推出ChatGPT新默认模型GPT-5.5 Instant,声称该模型在事实准确性上取得显著进步。据内部评估,与GPT-5.3 Instant相比,新模型在医疗、法律、金融等高风险领域的幻觉内容减少52.5%,在用户标记的事实错误对话中,不准确内容降低37.3%。此外,新模型回复更简洁、减少多余表情符号,并增强个性化功能,可调用历史对话和Gmail内容。GPT-5.5 Instant将向全体用户开放,GPT-5.3 Instant将保留三个月后退役。

新模型名为GPT-5.5 Instant,同时还将减少"无意义"表情符号的使用。

OpenAI最新推出的ChatGPT默认模型,在虚构内容方面可能将有所改善。幻觉问题一直是AI模型面临的顽固难题,但OpenAI表示,其新模型GPT-5.5 Instant在"事实准确性方面实现了全面显著提升"。

该公司称,基于"内部评估",GPT-5.5 Instant在"涉及医疗、法律和金融等高风险领域的提示词测试中,产生的幻觉内容比GPT-5.3 Instant减少了52.5%"。此外,在"用户标记为存在事实错误的高难度对话中,不准确内容减少了37.3%"。OpenAI在GPT-5.5 Instant的系统说明文档中提供了部分评估方法的相关介绍。

我们不能再对AI的幻觉问题视而不见

OpenAI还表示,GPT-5.5 Instant"在日常任务中的能力更为出色",例如分析上传的图片,以及判断何时应主动联网获取答案。GPT-5.5 Instant的回复更加"简洁、直击要点",并将避免出现"毫无意义的表情符号"。

借助GPT-5.5 Instant,ChatGPT现在能够更有效地整合来自历史对话、Gmail等渠道的上下文信息,从而为用户提供更具个性化的回复。这也是谷歌正在为Gemini大力投入的功能方向。此外,针对所有ChatGPT模型,新增的"记忆来源"功能将允许用户查看哪些上下文信息被用于生成个性化回复,并可自行删除或修正相关内容。

OpenAI将于本周二开始向"所有ChatGPT用户"推送GPT-5.5 Instant,而GPT-5.3 Instant仍将作为可选项保留三个月,之后才会正式"退役"。考虑到过去用户曾对旧版模型的下线表示遗憾,此次安排旨在给用户留出充分的过渡时间。

增强版个性化功能将优先向Plus和Pro用户在网页端开放,移动端版本"即将推出"。OpenAI已有计划,将"尽快"为免费版、Go版、商业版及企业版用户提供相同功能。记忆来源功能目前已开始向ChatGPT消费者套餐用户的网页端推送,移动端支持也将"很快跟进"。

Q&A

Q1:GPT-5.5 Instant的幻觉问题有多大改善?

A:根据OpenAI的内部评估,GPT-5.5 Instant在医疗、法律、金融等高风险领域的提示词测试中,幻觉内容比GPT-5.3 Instant减少了52.5%;在用户标记为存在事实错误的高难度对话中,不准确内容也减少了37.3%。

Q2:GPT-5.5 Instant的个性化功能是如何运作的?

A:GPT-5.5 Instant可整合历史对话、Gmail等来源的上下文信息,为用户提供更个性化的回复。新增的"记忆来源"功能还允许用户查看哪些信息被用于生成个性化内容,并可自行删除或修正,目前该功能已向消费者套餐用户的网页端推送。

Q3:GPT-5.5 Instant什么时候向所有用户开放?

A:OpenAI将于本周二开始向所有ChatGPT用户推送GPT-5.5 Instant。增强版个性化功能将优先面向Plus和Pro用户在网页端开放,免费版、Go版、商业版及企业版用户的支持计划"即将推出"。

来源:The Verge

0赞

好文章,需要你的鼓励

2026

05/08

13:38

分享

点赞

邮件订阅