OpenAI周四发布了其最新AI模型GPT-5.5,并将其称为迄今为止"最智能、最直观易用的模型"。该模型在多个领域实现了能力提升,OpenAI联合创始人兼总裁格雷格·布罗克曼表示,这也让公司距离打造OpenAI"超级应用"的目标又近了一步。
在与记者的电话沟通中,布罗克曼表示,新模型是迈向"更具智能体特性与直觉化计算"的重大进展。
"这个模型是朝着我们所期望的未来计算形态迈出的真正一步——但这只是其中一步,我们预计未来还会有许多步。"布罗克曼说道,"相比GPT-5.4,它能以更少的Token实现更快速、更敏锐的思考。这意味着企业和消费者可以获得更多前沿AI能力,这也是我们目标的一部分。"
布罗克曼还表示,该模型是推进打造"超级应用"的又一步——这是一款多功能、如瑞士军刀般全能的程序,他与联合创始人萨姆·奥特曼此前曾多次提及这一计划。两位联合创始人设想将ChatGPT、Codex以及AI浏览器整合为一个统一服务,以助力企业客户。值得注意的是,"超级应用"概念同样备受奥特曼竞争对手(也是前OpenAI同事)埃隆·马斯克的关注,他曾表示希望将X(前身为Twitter)打造成自己的超级应用。
OpenAI上个月才刚刚发布了上一款模型,此前还分别于去年12月和11月发布过新版本。该公司持续以较高频率推出新模型,公司员工表示这一趋势在可预见的未来将持续下去。"我们预计短期内将看到相当显著的进步,中期内则是极为显著的进步。"OpenAI首席科学家雅库布·帕霍基说,"事实上,我甚至认为过去两年的进展出乎意料地慢了。"
据OpenAI介绍,GPT-5.5被设计为可在广泛领域发挥作用,包括智能体编程和知识工作等核心企业应用场景,以及数学和科学研究等更具探索性的AI应用。公司周四同步发布了数据,展示了该模型在一系列基准测试中的卓越表现。OpenAI表示,与此前的模型及谷歌、Anthropic的竞品(如Gemini 3.1 Pro和Claude Opus 4.5)相比,GPT-5.5均取得了更高分数。
OpenAI与Anthropic之间的竞争始终是业界热议的话题,GPT-5.5的发布再次为两家公司提供了相互比较的契机。在新闻发布会上,有记者询问GPT-5.5是否将具备类似于Anthropic近期发布的网络安全工具Mythos的能力(Mythos近日因一份关于未授权访问的报告而陷入争议)。OpenAI技术团队成员米娅·格莱塞表示,GPT-5.5将对公司在数字防御领域的模型部署策略产生重大影响。"我们在网络安全方面有着强大且长期的战略布局,并已形成了一套行之有效的安全模型部署方法。"格莱塞说道。
OpenAI首席研究官马克·陈表示,GPT-5.5在处理计算机任务方面优于前代产品,并指出该模型"在科学与技术研究工作流程上取得了实质性提升",认为它能够真正"帮助专业科学家取得进展"。他还表示,该模型可协助推进药物研发——这一领域近年来在业界的关注度持续升温。
据OpenAI介绍,GPT-5.5已于周四起全面上线。公司表示,该模型将向ChatGPT的Plus、Pro、Business及Enterprise用户开放,而GPT-5.5 Pro版本则面向Pro、Business及Enterprise用户推出。
Q&A
Q1:GPT-5.5相比GPT-5.4有哪些提升?
A:GPT-5.5能够以更少的Token实现更快速、更敏锐的思考,在智能体编程、知识工作、数学研究和科学研究等多个领域均有能力提升。在基准测试中,GPT-5.5的得分也高于谷歌Gemini 3.1 Pro和Anthropic Claude Opus 4.5等竞品模型。
Q2:OpenAI计划打造的"超级应用"是什么?
A:OpenAI联合创始人布罗克曼和奥特曼设想将ChatGPT、Codex以及AI浏览器整合为一个统一的多功能服务平台,主要面向企业客户。GPT-5.5被视为朝这一目标迈进的重要一步,体现了更强的智能体特性与直觉化计算能力。
Q3:GPT-5.5向哪些用户开放?
A:GPT-5.5目前已全面上线,向ChatGPT的Plus、Pro、Business及Enterprise用户开放;GPT-5.5 Pro版本则面向Pro、Business及Enterprise用户提供。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。