OpenAI周四发布了其最新AI模型GPT-5.5,并将其称为迄今为止"最智能、最直观易用的模型"。该模型在多个领域实现了能力提升,OpenAI联合创始人兼总裁格雷格·布罗克曼表示,这也让公司距离打造OpenAI"超级应用"的目标又近了一步。
在与记者的电话沟通中,布罗克曼表示,新模型是迈向"更具智能体特性与直觉化计算"的重大进展。
"这个模型是朝着我们所期望的未来计算形态迈出的真正一步——但这只是其中一步,我们预计未来还会有许多步。"布罗克曼说道,"相比GPT-5.4,它能以更少的Token实现更快速、更敏锐的思考。这意味着企业和消费者可以获得更多前沿AI能力,这也是我们目标的一部分。"
布罗克曼还表示,该模型是推进打造"超级应用"的又一步——这是一款多功能、如瑞士军刀般全能的程序,他与联合创始人萨姆·奥特曼此前曾多次提及这一计划。两位联合创始人设想将ChatGPT、Codex以及AI浏览器整合为一个统一服务,以助力企业客户。值得注意的是,"超级应用"概念同样备受奥特曼竞争对手(也是前OpenAI同事)埃隆·马斯克的关注,他曾表示希望将X(前身为Twitter)打造成自己的超级应用。
OpenAI上个月才刚刚发布了上一款模型,此前还分别于去年12月和11月发布过新版本。该公司持续以较高频率推出新模型,公司员工表示这一趋势在可预见的未来将持续下去。"我们预计短期内将看到相当显著的进步,中期内则是极为显著的进步。"OpenAI首席科学家雅库布·帕霍基说,"事实上,我甚至认为过去两年的进展出乎意料地慢了。"
据OpenAI介绍,GPT-5.5被设计为可在广泛领域发挥作用,包括智能体编程和知识工作等核心企业应用场景,以及数学和科学研究等更具探索性的AI应用。公司周四同步发布了数据,展示了该模型在一系列基准测试中的卓越表现。OpenAI表示,与此前的模型及谷歌、Anthropic的竞品(如Gemini 3.1 Pro和Claude Opus 4.5)相比,GPT-5.5均取得了更高分数。
OpenAI与Anthropic之间的竞争始终是业界热议的话题,GPT-5.5的发布再次为两家公司提供了相互比较的契机。在新闻发布会上,有记者询问GPT-5.5是否将具备类似于Anthropic近期发布的网络安全工具Mythos的能力(Mythos近日因一份关于未授权访问的报告而陷入争议)。OpenAI技术团队成员米娅·格莱塞表示,GPT-5.5将对公司在数字防御领域的模型部署策略产生重大影响。"我们在网络安全方面有着强大且长期的战略布局,并已形成了一套行之有效的安全模型部署方法。"格莱塞说道。
OpenAI首席研究官马克·陈表示,GPT-5.5在处理计算机任务方面优于前代产品,并指出该模型"在科学与技术研究工作流程上取得了实质性提升",认为它能够真正"帮助专业科学家取得进展"。他还表示,该模型可协助推进药物研发——这一领域近年来在业界的关注度持续升温。
据OpenAI介绍,GPT-5.5已于周四起全面上线。公司表示,该模型将向ChatGPT的Plus、Pro、Business及Enterprise用户开放,而GPT-5.5 Pro版本则面向Pro、Business及Enterprise用户推出。
Q&A
Q1:GPT-5.5相比GPT-5.4有哪些提升?
A:GPT-5.5能够以更少的Token实现更快速、更敏锐的思考,在智能体编程、知识工作、数学研究和科学研究等多个领域均有能力提升。在基准测试中,GPT-5.5的得分也高于谷歌Gemini 3.1 Pro和Anthropic Claude Opus 4.5等竞品模型。
Q2:OpenAI计划打造的"超级应用"是什么?
A:OpenAI联合创始人布罗克曼和奥特曼设想将ChatGPT、Codex以及AI浏览器整合为一个统一的多功能服务平台,主要面向企业客户。GPT-5.5被视为朝这一目标迈进的重要一步,体现了更强的智能体特性与直觉化计算能力。
Q3:GPT-5.5向哪些用户开放?
A:GPT-5.5目前已全面上线,向ChatGPT的Plus、Pro、Business及Enterprise用户开放;GPT-5.5 Pro版本则面向Pro、Business及Enterprise用户提供。
好文章,需要你的鼓励
近期数据显示,2026年5月前企业已宣布约9万个与AI相关的裁员岗位,部分预测称未来五年美国15%的工作将被AI取代。然而,Ramp与Revelio Labs追踪近2.2万家企业的最新报告显示:重度投入AI的企业反而实现了更快的人员增长,包括初级岗位在内的各职能人数均有上升。但这一数据主要来自技术型企业,能否普遍适用仍存疑。报告同时指出,资源匮乏的企业可能在AI浪潮中持续落后。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
AI数据中心开发商向多家电力公司同时提交大负荷接入申请以确定选址,导致区域需求预测虚高、电网投资失衡。美国联邦能源监管委员会(FERC)及ERCOT、PJM、SPP等机构正推动"承诺优先"规划机制,要求项目具备实质性商业承诺方可纳入长期传输规划。谷歌、亚马逊、微软、OpenAI等科技巨头支持建立标准化的项目成熟度评估体系,但各方在具体机制上仍存分歧。发电建设问题尚未被纳入联邦传输改革议程。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。