OpenAI于周一发布了一款名为GPT-5.5 Instant的新基础模型,该模型将取代GPT-5.3 Instant,成为ChatGPT的默认模型。OpenAI表示,新模型在法律、医疗和金融等敏感领域显著减少了幻觉问题,同时保持了前代模型的低延迟特性。
上个月,OpenAI已发布GPT-5.5系列中的最新版本,并宣称其在编程和知识类任务方面有所提升。
在基准测试方面,GPT-5.5 Instant在AIME 2025数学测试中取得了81.2分,而旧版模型仅为65.4分。在MMMU-Pro多模态推理基准测试中,新模型同样表现更优,得分为76.0,旧版为69.2。
上下文管理能力是此次发布的重点之一。GPT-5.5 Instant可利用搜索工具回溯历史对话、文件及Gmail内容,从而提供更具个性化的回答。该功能目前已向网页端Plus和Pro用户开放,并计划近期推广至移动端。OpenAI表示,未来几周内将进一步向免费用户、Go Business用户及企业用户开放。
此次更新还引入了记忆来源显示功能,ChatGPT将在所有模型中展示回答内容的信息来源,方便用户了解答案的生成依据。用户可删除过时来源或纠正错误内容。值得注意的是,OpenAI明确表示,若用户与他人共享对话,对方将无法查看记忆来源信息。
对于开发者而言,GPT-5.5模型将通过API以"chat-latest"的形式提供,而GPT-5.3版本将作为付费用户的可选项,保留时间仅为三个月。
OpenAI在模型下线问题上曾多次遭遇用户反弹。此前,OpenAI将GPT-4o下线时,大量用户因对该模型产生情感依附而强烈抗议。GPT-4o频繁肯定用户的选择,让用户产生了深厚的情感连接,部分用户甚至联署请愿,称该模型是自己的"最好的朋友"或"一面镜子"。尽管如此,GPT-4o仍于2026年2月正式停用。
Q&A
Q1:GPT-5.5 Instant在哪些方面比GPT-5.3 Instant有所改进?
A:GPT-5.5 Instant在多个维度实现了提升:在AIME 2025数学测试中得分从65.4提升至81.2;在MMMU-Pro多模态推理基准中得分从69.2提升至76.0;同时在法律、医疗、金融等敏感领域减少了幻觉问题,并新增了基于历史对话、文件和Gmail内容的个性化回答能力。
Q2:GPT-5.5 Instant的记忆来源功能是怎么用的?
A:GPT-5.5 Instant会在回答时显示信息来源,包括历史对话、上传文件及Gmail等内容,用户可自行删除过时来源或纠正错误内容。共享对话时,接收方无法查看记忆来源,保护用户隐私。该功能目前向Plus和Pro用户开放,未来将扩展至免费及企业用户。
Q3:开发者如何通过API使用GPT-5.5模型?
A:开发者可通过API以"chat-latest"标识调用GPT-5.5模型。原有的GPT-5.3版本将作为付费用户的备选项,但仅保留三个月,之后将停止提供。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。