在更新 Preparedness Framework ( OpenAI 用于决定 AI 模型是否安全以及在开发和发布过程中需要采取何种安全措施的内部框架)时,OpenAI 表示,如果竞争对手的 AI 实验室推出没有相应安全措施的“高风险”系统,其可能会“调整”自身的安全要求。
这一变化反映了商业 AI 开发者在竞争压力日益加剧的环境下,加速部署模型的趋势。OpenAI 曾被指责为为了更快推出产品而降低安全标准,并未能及时提供详细说明其安全测试的报告。上周,有 12 位前 OpenAI 员工在 Elon Musk 针对 OpenAI 提起的诉讼中提交了一份简报,主张如果 OpenAI 完成其计划中的公司重组,该公司可能会因此进一步削减安全措施的要求。
或许早有预料,OpenAI 声称不会轻易做出这些政策调整,并且会将其安全措施保持在“更高保护水平”。
OpenAI 在周二下午发布的一篇博客文章中写道:“如果另一家前沿 AI 开发者推出了没有相应安全措施的高风险系统,我们可能会调整我们的要求。然而,我们首先会严格确认风险形势确实发生了变化,公开承认我们正在做出调整,对该调整评估是否不会显著增加整体的严重伤害风险,并且仍将安全措施保持在更高的保护水平。”
更新后的 Preparedness Framework 同时明确表示,OpenAI 正在更大程度上依赖自动化评估来加速产品开发。公司表示,虽然并未完全放弃由人工主导的测试,但已构建出“一系列不断扩展的自动化评估工具”,据称这些工具可以“跟上更快的发布节奏”。
一些报道对此提出了异议。据《金融时报》报道,OpenAI 为即将推出的一款重大全新模型的安全检查给予测试人员不足一周的时间——相比之前的版本时间更为紧张。该刊物的消息来源还称,OpenAI 的许多安全测试现在是在公开发布版本之前的早期模型上进行的。
对于 OpenAI 是否在安全问题上做出妥协的说法,该公司在声明中进行了驳斥。
OpenAI 正悄然降低其安全承诺。 —— Steven Adler (@sjgadler) 2025 年 4 月 15 日
OpenAI Framework 的其他变更涉及到公司如何根据风险对模型进行分类,包括那些能够隐藏其能力、逃避安全措施、阻止系统关闭甚至实现自我复制的模型。OpenAI 表示,现在将重点关注模型是否达到以下两个阈值之一:“高”能力或“关键”能力。
根据 OpenAI 的定义,前者指的是能够“放大现有导致严重伤害途径”的模型;后者则指那些“引入前所未有、导致严重伤害的新途径”的模型。
OpenAI 在其博客文章中写道:“达到高能力标准的系统在部署前必须具备能够充分最小化相关严重伤害风险的安全措施;达到关键能力标准的系统在开发过程中也需要具备能够充分最小化相关风险的安全措施。”
这是 OpenAI 自 2023 年以来首次对 Preparedness Framework 进行更新。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。