OpenAI发布GPT-5.5，数学与编程能力大幅跃升

OpenAI正式推出GPT-5.5大语言模型，在数学推理和代码编写方面较前代有显著提升。该模型分为标准版和更强大的Pro版两种规格。GPT-5.5能自动处理模糊指令，无需用户逐步说明任务细节。在FrontierMath Tier 4博士级数学测试中，Pro版得分39.6%，近乎是竞争对手Claude Opus 4.7的两倍。此外，GPT-5.5已帮助OpenAI优化内部基础设施管理软件，使token生成速度提升逾20%。目前该模型已向ChatGPT付费用户开放。

OpenAI近日正式推出新一代大语言模型GPT-5.5，该模型在数学解题与代码编写方面相较前代产品有显著提升。

GPT-5.5的发布时间恰好在竞争对手Anthropic推出其最新大语言模型一周之后。OpenAI为用户提供两种版本选择：标准版以及功能更强、定价更高的GPT-5.5 Pro版。

据OpenAI介绍，两个版本均在多个维度上实现了输出质量的提升。标准版GPT-5.5在计算机操作任务和知识工作方面优于上一代模型，而GPT-5.5 Pro则在商业、法律、教育和数据科学等应用场景中带来了尤为突出的质量提升。

GPT-5.5还增强了对模糊指令的理解能力。以往，大语言模型的用户往往需要逐步描述任务细节，否则容易产生输出错误。而GPT-5.5能够自动推断出相关细节，例如在用户未作说明的情况下，自行判断如何使用MCP服务器。

OpenAI将GPT-5.5与Anthropic上周发布的新款大语言模型Claude Opus 4.7进行了超过十项基准测试的横向对比，GPT-5.5的标准版和Pro版在其中多项测试中均取得了更优异的成绩。

在OpenAI测试集中难度最高的基准之一FrontierMath Tier 4上，该测试包含数十道博士后级别的数学难题，人类专家往往需要数天时间才能解答。GPT-5.5 Pro的得分为39.6%，接近Claude Opus 4.7所得22.9%的两倍。

OpenAI还表示，GPT-5.5的定制版本已协助研究人员发现了一个全新的数学证明——一组用于验证数学定理的方程式，该证明与"拉姆齐数"相关。拉姆齐数是组合数学领域的重要研究对象，在计算机科学中具有广泛的应用价值。

在编程能力方面，GPT-5.5同样领先于竞品。标准版大语言模型在Terminal-Bench 2.0基准测试中获得82.7%的高分，该测试衡量大语言模型使用命令行工具的能力，而Claude Opus 4.7的得分为69.4%。

OpenAI表示，GPT-5.5的编程能力已在内部得到实际应用，该模型协助优化了管理其运行基础设施的软件。该基础设施由英伟达的GB200和GB300 NVL72系统组成，分别搭载了英伟达Blackwell B200和Blackwell Ultra图形处理器。

由于GPU拥有远多于CPU的处理核心，OpenAI的基础设施管理软件会将发送至GPU的大语言模型请求批量打包，并分发至芯片的各个核心进行处理。据OpenAI介绍，GPT-5.5开发出了一种更高效的处理方式，使Token生成速度提升了20%以上。

此外，该模型在非技术类任务上同样表现出色。GPT-5.5在GDPval基准数据集上创下新纪录，该数据集用于测试大语言模型在44个领域完成经济价值任务的能力。值得关注的是，GPT-5.5标准版以84.9%的得分超越了Pro版以及Claude Opus 4.7。

目前，GPT-5.5已面向ChatGPT和Codex的Plus、Pro、Business及Enterprise订阅用户开放使用。GPT-5.5 Pro则仅在后三种订阅方案中通过ChatGPT提供。OpenAI表示，将"很快"通过应用程序编程接口向开发者开放该模型。

Q&A

Q1：GPT-5.5和GPT-5.5 Pro有什么区别？

A：GPT-5.5提供标准版和Pro版两种版本。标准版在计算机操作任务和知识工作方面表现更优，而Pro版则在商业、法律、教育和数据科学等场景中带来更大幅度的质量提升，但价格也更高。Pro版仅面向Pro、Business和Enterprise订阅用户开放。

Q2：GPT-5.5在数学方面的能力有多强？

A：GPT-5.5 Pro在FrontierMath Tier 4基准测试中得分39.6%，该测试包含数十道需要人类专家花费数天时间才能解答的博士后级别数学难题。这一成绩接近竞争对手Claude Opus 4.7所得22.9%的两倍。此外，GPT-5.5的定制版本还协助研究人员发现了与拉姆齐数相关的全新数学证明。

Q3：GPT-5.5如何提升了Token生成速度？

A：GPT-5.5协助优化了OpenAI管理GPU基础设施的软件。该软件负责将大语言模型请求批量分发至GPU的各个处理核心，GPT-5.5开发出了更高效的分发方式，最终使Token生成速度提升了20%以上。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

OpenAI发布GPT-5.5，数学与编程能力大幅跃升

来源：SiliconANGLE

2026

04/24

17:32

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Anthropic承认：试图让Claude更聪明时反而让它变笨了

ServiceNow押注安全与智能体AI，驱动持续营收增长

Sierra收购法国AI初创公司Fragment，加速智能体业务布局【正常】

Noscroll：用AI智能体替你完成信息流刷屏

Meta裁员约10%，削减逾8000个职位

如何用AI帮你找到最适合的大学专业

ChatGPT 5.5正式发布，专为数学、科研与AI研究优化

从茶叶占卜到AI预测：为何当今的高科技预言如此危险

OpenAI发布GPT-5.5模型：编程能力更强、效率更高

Claude Opus 4.7安全过滤器误伤合规请求，开发者怨声载道

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会