就在ChatGPT 5.4发布整整七周后,OpenAI再次推出了全新的模型系列。ChatGPT 5.5现已面向付费用户、Codex用户以及思考版和专业版用户开放,并计划近期接入API。这批新模型专为工作场景打造,重点覆盖编程、计算机操作与科学研究等方向。
OpenAI总裁格雷格·布罗克曼表示,GPT-5.5比此前的模型更具直觉性,能够在更少人工引导的情况下完成更多任务。
"它能够面对一个模糊的问题,自行判断出下一步该做什么,"布罗克曼在媒体发布会上表示,"这真的感觉像是在为我们未来的计算机工作方式奠定基础,也是大规模智能体计算的雏形。"
这是一款通用模型,任何人都可以使用,但对于从事研究或编程等高强度任务的用户而言,其价值将尤为突出。GPT-5.5具备智能体能力,可以独立完成任务,在衡量模型跨应用操作能力和数学解题能力的基准测试中,其得分均高于GPT-5.4。
OpenAI与其他科技公司都在致力于打造真正意义上的数字助手,能够跨越单一程序、统筹管理整台电脑上的通知和项目。GPT-5.5是该公司在这一方向上迄今最有力的一次探索。
OpenAI表示,GPT-5.5配备了迄今最强的网络安全防护机制,在发布初期将对涉及网络安全的请求采取更为保守的响应策略。这一决策背后,是对AI网络安全能力不断增强所引发的潜在风险的高度关注——越来越强大的AI模型可能发现现有互联网架构中的漏洞。正因如此,Anthropic的Claude Mythos Preview和OpenAI的5.4-Cyber版本都选择先向开发者开放,以便在公开发布前排查潜在问题。
AI赋能科学研究
对OpenAI而言,研究是一条双向通道。GPT-5.5不仅是该公司计划基于Codex打造超级应用的基础组件,同时也被广泛用于AI研究工作本身。布罗克曼透露,GPT-5.5和Codex在其自身的开发过程中就已得到应用。
过去几年,AI深刻改变了科研方式,但这一领域同样面临与其他行业相同的担忧——AI未来是否会将人类从工作岗位上替代。尽管GPT-5.5是OpenAI迄今能力最强的科研模型,但该公司的顶尖科学家和研究人员对于被AI取代并不感到忧虑。
OpenAI首席研究官马克·陈谈到了一个近期目标:让人类作为AI深度辅助下的研究"编排者"。
研究副总裁米娅·格拉泽则表示,她希望更强大的AI模型能够催生更多研究成果,并提升"值得去做的事情的门槛"。
"我感觉自己的工作效率更高了,因为挑战已经从厘清实现细节、处理底层抽象,转变为思考更高层面的目标,"OpenAI首席科学家雅库布·帕霍茨基说,"这让你能够更快地取得进展,把注意力和精力集中在思考'什么才是真正重要的事情'上……为了自动化而自动化,是没有意义的。"
Q&A
Q1:GPT-5.5具备哪些智能体能力?
A:GPT-5.5具备智能体能力,可以独立完成任务,无需大量人工干预。它能够面对模糊问题自行判断下一步行动,并可跨应用操作整台计算机,统筹管理通知和项目,而不局限于单一程序。在衡量跨应用操作和数学解题能力的基准测试中,其表现也优于上一版本GPT-5.4。
Q2:GPT-5.5在网络安全方面有哪些变化?
A:GPT-5.5配备了OpenAI迄今最强的网络安全防护机制。由于越来越强大的AI模型可能发现现有互联网架构中的潜在漏洞,GPT-5.5在发布初期将对涉及网络安全的请求采取更为保守的响应策略,以降低安全风险。
Q3:OpenAI的研究人员担心被GPT-5.5取代吗?
A:OpenAI的顶尖科学家和研究人员对被AI取代并不感到忧虑。首席研究官马克·陈表示,近期目标是让人类成为AI辅助研究的"编排者"。首席科学家帕霍茨基也指出,AI让研究人员能够将精力聚焦于更高层次的目标,而非陷入底层实现细节,工作效率反而得到了提升。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。