在更新 Preparedness Framework ( OpenAI 用于决定 AI 模型是否安全以及在开发和发布过程中需要采取何种安全措施的内部框架)时,OpenAI 表示,如果竞争对手的 AI 实验室推出没有相应安全措施的“高风险”系统,其可能会“调整”自身的安全要求。
这一变化反映了商业 AI 开发者在竞争压力日益加剧的环境下,加速部署模型的趋势。OpenAI 曾被指责为为了更快推出产品而降低安全标准,并未能及时提供详细说明其安全测试的报告。上周,有 12 位前 OpenAI 员工在 Elon Musk 针对 OpenAI 提起的诉讼中提交了一份简报,主张如果 OpenAI 完成其计划中的公司重组,该公司可能会因此进一步削减安全措施的要求。
或许早有预料,OpenAI 声称不会轻易做出这些政策调整,并且会将其安全措施保持在“更高保护水平”。
OpenAI 在周二下午发布的一篇博客文章中写道:“如果另一家前沿 AI 开发者推出了没有相应安全措施的高风险系统,我们可能会调整我们的要求。然而,我们首先会严格确认风险形势确实发生了变化,公开承认我们正在做出调整,对该调整评估是否不会显著增加整体的严重伤害风险,并且仍将安全措施保持在更高的保护水平。”
更新后的 Preparedness Framework 同时明确表示,OpenAI 正在更大程度上依赖自动化评估来加速产品开发。公司表示,虽然并未完全放弃由人工主导的测试,但已构建出“一系列不断扩展的自动化评估工具”,据称这些工具可以“跟上更快的发布节奏”。
一些报道对此提出了异议。据《金融时报》报道,OpenAI 为即将推出的一款重大全新模型的安全检查给予测试人员不足一周的时间——相比之前的版本时间更为紧张。该刊物的消息来源还称,OpenAI 的许多安全测试现在是在公开发布版本之前的早期模型上进行的。
对于 OpenAI 是否在安全问题上做出妥协的说法,该公司在声明中进行了驳斥。
OpenAI 正悄然降低其安全承诺。 —— Steven Adler (@sjgadler) 2025 年 4 月 15 日
OpenAI Framework 的其他变更涉及到公司如何根据风险对模型进行分类,包括那些能够隐藏其能力、逃避安全措施、阻止系统关闭甚至实现自我复制的模型。OpenAI 表示,现在将重点关注模型是否达到以下两个阈值之一:“高”能力或“关键”能力。
根据 OpenAI 的定义,前者指的是能够“放大现有导致严重伤害途径”的模型;后者则指那些“引入前所未有、导致严重伤害的新途径”的模型。
OpenAI 在其博客文章中写道:“达到高能力标准的系统在部署前必须具备能够充分最小化相关严重伤害风险的安全措施;达到关键能力标准的系统在开发过程中也需要具备能够充分最小化相关风险的安全措施。”
这是 OpenAI 自 2023 年以来首次对 Preparedness Framework 进行更新。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。