就在OpenAI批评Anthropic封闭AI模型策略的几周之后,OpenAI自己也悄然对新发布的GPT-5.5-Cyber模型设置了访问门槛,仅向特定"网络安全守护者"群体开放。
CEO山姆·奥特曼在X平台发帖称,该模型将于"未来几天内"开始推进有限度的发布,访问权限将限定于他所描述的"受信任的安全防御者",即那些致力于保护关键系统安全的人员。
他写道:"我们将与整个生态系统及政府合作,共同厘清网络安全领域的受信访问机制。"他补充表示,目标是"快速帮助企业和基础设施提升安全防护能力"。
GPT-5.5-Cyber专为抢在恶意攻击者之前发现漏洞而设计。OpenAI表示,该模型具备渗透测试、漏洞挖掘、漏洞利用以及恶意软件分析等能力。然而,历史经验表明,能够突破系统防线的工具往往难以永远掌握在"正确的人"手中。
此次发布距Anthropic推出旗下网络安全专项模型Claude Mythos仅数周之隔。彼时,Anthropic将Claude Mythos的访问权限限制在约50家机构范围内,并宣称该模型永远不会向公众开放。对此,奥特曼公开表达了不满。
据TechCrunch报道,奥特曼在参与Core Memory播客节目时,将Anthropic的做法定性为"以谨慎为名行垄断之实"。他表示:"世界上有些人长期以来都希望将AI牢牢掌握在少数人手中,这种做法可以用各种理由来为自己辩护。"他进一步用更为犀利的比喻抨击道:"我们造了一颗炸弹,正准备扔到你头上,然后我们以1亿美元的价格向你出售一个防空掩体。"
而如今,OpenAI虽然未必是在建造同一个"掩体",却也开始在门口核查入场者的身份了。
独立测试结果表明,GPT-5.5-Cyber并非只是营销噱头。英国AI安全研究所本周表示,该模型是"迄今在网络安全任务中测试过的最强模型之一",并指出它是继某一系统之后,第二个能够端到端完成多步骤攻击模拟的系统。
这款模型或许以安全防护为定位,但当同一工具既能破坏系统又能修复系统时,真正的差别往往只在于——谁先抵达。
Q&A
Q1:GPT-5.5-Cyber是什么?它有哪些核心能力?
A:GPT-5.5-Cyber是OpenAI推出的一款专为网络安全场景设计的AI模型,具备渗透测试、漏洞挖掘与利用、恶意软件分析等能力,旨在帮助安全防御者抢在恶意攻击者之前发现并修复系统漏洞。英国AI安全研究所评价其为"迄今测试过的最强网络安全模型之一",并且是第二个能够端到端完成多步骤攻击模拟的系统。
Q2:OpenAI为什么不向公众开放GPT-5.5-Cyber?
A:OpenAI表示,GPT-5.5-Cyber目前仅向受信任的网络安全防御者群体开放,原因在于该模型兼具攻击与防御能力,若落入不当之手存在较大风险。OpenAI计划与政府及整个生态系统合作,共同建立合理的受信访问机制,再逐步扩大使用范围。
Q3:OpenAI批评Anthropic限制Claude Mythos访问权限,自己却也这样做,是否前后矛盾?
A:确实存在明显的立场反差。奥特曼此前批评Anthropic将Claude Mythos限制在约50家机构内,并将其类比为"贩卖恐惧"。而如今GPT-5.5-Cyber同样采用了受限访问策略,外界普遍认为OpenAI此举与其之前的公开批评存在矛盾,引发了广泛关注与讨论。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。