新模型名为GPT-5.5 Instant,同时还将减少"无意义"表情符号的使用。
OpenAI最新推出的ChatGPT默认模型,在虚构内容方面可能将有所改善。幻觉问题一直是AI模型面临的顽固难题,但OpenAI表示,其新模型GPT-5.5 Instant在"事实准确性方面实现了全面显著提升"。
该公司称,基于"内部评估",GPT-5.5 Instant在"涉及医疗、法律和金融等高风险领域的提示词测试中,产生的幻觉内容比GPT-5.3 Instant减少了52.5%"。此外,在"用户标记为存在事实错误的高难度对话中,不准确内容减少了37.3%"。OpenAI在GPT-5.5 Instant的系统说明文档中提供了部分评估方法的相关介绍。
我们不能再对AI的幻觉问题视而不见
OpenAI还表示,GPT-5.5 Instant"在日常任务中的能力更为出色",例如分析上传的图片,以及判断何时应主动联网获取答案。GPT-5.5 Instant的回复更加"简洁、直击要点",并将避免出现"毫无意义的表情符号"。
借助GPT-5.5 Instant,ChatGPT现在能够更有效地整合来自历史对话、Gmail等渠道的上下文信息,从而为用户提供更具个性化的回复。这也是谷歌正在为Gemini大力投入的功能方向。此外,针对所有ChatGPT模型,新增的"记忆来源"功能将允许用户查看哪些上下文信息被用于生成个性化回复,并可自行删除或修正相关内容。
OpenAI将于本周二开始向"所有ChatGPT用户"推送GPT-5.5 Instant,而GPT-5.3 Instant仍将作为可选项保留三个月,之后才会正式"退役"。考虑到过去用户曾对旧版模型的下线表示遗憾,此次安排旨在给用户留出充分的过渡时间。
增强版个性化功能将优先向Plus和Pro用户在网页端开放,移动端版本"即将推出"。OpenAI已有计划,将"尽快"为免费版、Go版、商业版及企业版用户提供相同功能。记忆来源功能目前已开始向ChatGPT消费者套餐用户的网页端推送,移动端支持也将"很快跟进"。
Q&A
Q1:GPT-5.5 Instant的幻觉问题有多大改善?
A:根据OpenAI的内部评估,GPT-5.5 Instant在医疗、法律、金融等高风险领域的提示词测试中,幻觉内容比GPT-5.3 Instant减少了52.5%;在用户标记为存在事实错误的高难度对话中,不准确内容也减少了37.3%。
Q2:GPT-5.5 Instant的个性化功能是如何运作的?
A:GPT-5.5 Instant可整合历史对话、Gmail等来源的上下文信息,为用户提供更个性化的回复。新增的"记忆来源"功能还允许用户查看哪些信息被用于生成个性化内容,并可自行删除或修正,目前该功能已向消费者套餐用户的网页端推送。
Q3:GPT-5.5 Instant什么时候向所有用户开放?
A:OpenAI将于本周二开始向所有ChatGPT用户推送GPT-5.5 Instant。增强版个性化功能将优先面向Plus和Pro用户在网页端开放,免费版、Go版、商业版及企业版用户的支持计划"即将推出"。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。