就在ChatGPT 5.4发布整整七周后,OpenAI再次推出了全新的模型系列。ChatGPT 5.5现已面向付费用户、Codex用户以及思考版和专业版用户开放,并计划近期接入API。这批新模型专为工作场景打造,重点覆盖编程、计算机操作与科学研究等方向。
OpenAI总裁格雷格·布罗克曼表示,GPT-5.5比此前的模型更具直觉性,能够在更少人工引导的情况下完成更多任务。
"它能够面对一个模糊的问题,自行判断出下一步该做什么,"布罗克曼在媒体发布会上表示,"这真的感觉像是在为我们未来的计算机工作方式奠定基础,也是大规模智能体计算的雏形。"
这是一款通用模型,任何人都可以使用,但对于从事研究或编程等高强度任务的用户而言,其价值将尤为突出。GPT-5.5具备智能体能力,可以独立完成任务,在衡量模型跨应用操作能力和数学解题能力的基准测试中,其得分均高于GPT-5.4。
OpenAI与其他科技公司都在致力于打造真正意义上的数字助手,能够跨越单一程序、统筹管理整台电脑上的通知和项目。GPT-5.5是该公司在这一方向上迄今最有力的一次探索。
OpenAI表示,GPT-5.5配备了迄今最强的网络安全防护机制,在发布初期将对涉及网络安全的请求采取更为保守的响应策略。这一决策背后,是对AI网络安全能力不断增强所引发的潜在风险的高度关注——越来越强大的AI模型可能发现现有互联网架构中的漏洞。正因如此,Anthropic的Claude Mythos Preview和OpenAI的5.4-Cyber版本都选择先向开发者开放,以便在公开发布前排查潜在问题。
AI赋能科学研究
对OpenAI而言,研究是一条双向通道。GPT-5.5不仅是该公司计划基于Codex打造超级应用的基础组件,同时也被广泛用于AI研究工作本身。布罗克曼透露,GPT-5.5和Codex在其自身的开发过程中就已得到应用。
过去几年,AI深刻改变了科研方式,但这一领域同样面临与其他行业相同的担忧——AI未来是否会将人类从工作岗位上替代。尽管GPT-5.5是OpenAI迄今能力最强的科研模型,但该公司的顶尖科学家和研究人员对于被AI取代并不感到忧虑。
OpenAI首席研究官马克·陈谈到了一个近期目标:让人类作为AI深度辅助下的研究"编排者"。
研究副总裁米娅·格拉泽则表示,她希望更强大的AI模型能够催生更多研究成果,并提升"值得去做的事情的门槛"。
"我感觉自己的工作效率更高了,因为挑战已经从厘清实现细节、处理底层抽象,转变为思考更高层面的目标,"OpenAI首席科学家雅库布·帕霍茨基说,"这让你能够更快地取得进展,把注意力和精力集中在思考'什么才是真正重要的事情'上……为了自动化而自动化,是没有意义的。"
Q&A
Q1:GPT-5.5具备哪些智能体能力?
A:GPT-5.5具备智能体能力,可以独立完成任务,无需大量人工干预。它能够面对模糊问题自行判断下一步行动,并可跨应用操作整台计算机,统筹管理通知和项目,而不局限于单一程序。在衡量跨应用操作和数学解题能力的基准测试中,其表现也优于上一版本GPT-5.4。
Q2:GPT-5.5在网络安全方面有哪些变化?
A:GPT-5.5配备了OpenAI迄今最强的网络安全防护机制。由于越来越强大的AI模型可能发现现有互联网架构中的潜在漏洞,GPT-5.5在发布初期将对涉及网络安全的请求采取更为保守的响应策略,以降低安全风险。
Q3:OpenAI的研究人员担心被GPT-5.5取代吗?
A:OpenAI的顶尖科学家和研究人员对被AI取代并不感到忧虑。首席研究官马克·陈表示,近期目标是让人类成为AI辅助研究的"编排者"。首席科学家帕霍茨基也指出,AI让研究人员能够将精力聚焦于更高层次的目标,而非陷入底层实现细节,工作效率反而得到了提升。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。