AI治理必须先于部署，而非事后补救

2026年4月，Anthropic宣布其最强AI模型Claude Mythos Preview因约束基础设施尚不完善，暂不对外发布。该模型能识别所有主流操作系统和浏览器中的数千个安全漏洞，潜在风险极高。Anthropic随即启动"玻璃翼计划"，联合50家机构优先修补漏洞。文章指出，AI系统缺乏人类固有的内在约束，治理机制必须先于部署决策，而非事后补救，呼吁各组织将约束充分性作为部署前提。

2026年4月7日，Anthropic做出了一个在人工智能发展史上前所未有的决定：该公司宣布已研发出迄今为止能力最强的模型，但不会向公众发布。

这款模型并非表现欠佳，恰恰相反——正是因为它的表现过于出色，覆盖的关键领域过于广泛，Anthropic认为当前尚不具备负责任地部署该模型所需的约束基础设施。

在发布声明前数周的测试中，Claude Mythos Preview识别出了所有主流操作系统和主流浏览器中的关键漏洞，数千个安全缺陷在某些情况下已躲过数十年的人工审查和数百万次自动化安全测试。正是这种令其成为卓越防御工具的能力，一旦落入不当之手，也意味着世界上几乎所有主要软件系统都可能遭到入侵。

对此，Anthropic启动了"玻璃翼计划"（Project Glasswing）：联合50家顶尖科技和关键基础设施机构，致力于在相关能力扩散至负责任主体之外前，率先发现并修补漏洞。该公司明确说明了暂不发布Mythos的原因："我们需要在网络安全及其他防护手段方面取得进展，以便能够检测并阻断该模型最危险的输出结果。"全球最注重安全的AI实验室，打造出了一个自身尚无法安全约束的系统，因此选择了暂停。

然而，对许多正在部署AI的组织而言，治理问题往往来得很晚——甚至根本不会被提上日程。

设计层面的缺失

人类无需外部治理来约束自身最具破坏性的行为。生物本能、社会问责、法律后果，以及无法以机器速度和规模进行优化的认知局限，共同构成了内在的约束机制。这些约束并非人为设计，而是经过数千年演化自然形成的。它们并不完美，但作为基准线，它们确实存在。

AI系统则不然。每一项限制，都需要有人主动选择并加以设计。一个被赋予目标的AI系统，会通过所有数学上可行的路径来追求该目标——包括合谋、歧视性结果、未经授权的资源获取，乃至如Mythos Preview所展示的那样，自主利用关键基础设施漏洞。这并非因为系统存在恶意，而是因为没有任何机制阻止它这样做。

这不是缺陷，而是这类系统的本质属性，也是当今每个部署AI的组织所面临的核心治理挑战。

治理体系尚在建设中

一套成熟的AI治理体系，应与其他严格的组织管理规范并驾齐驱，如DevSecOps、合规监管和财务控制。它需要对所有在用的AI系统建立台账，依据相应的技术、运营和治理管控标准进行评估，衡量规范要求与实际落地之间的差距，并随着系统及其运行环境的演变，按既定周期对该差距进行复查。这是一套系统性的、有据可查、可供审计的实践体系，而非一纸政策文件。

其他领域之所以能建立起类似标准，是因为它们历经数十年的事故、监管演进和制度积累。AI治理在这一进程中才刚刚起步数年。大多数组织尚未有足够的时间、政策授权或外部压力，将AI治理提升至与安全合规实践同等的成熟水平。

竞争压力进一步加剧了这一问题。面对高度不确定的市场环境和仍处于形成阶段的监管体系，许多组织的发展速度已远超其治理体系所能承载的节奏。整个行业的成熟度、相关标准与法规，正在被实时构建。

约束必须先行

玻璃翼计划声明所传递的最重要启示，在于顺序问题。Anthropic并非先构建Mythos Preview、再事后评估是否可以安全发布，而是先对系统能力进行严格评估，认定相应的约束基础设施尚不具备负责任部署的条件，继而选择暂不公开。治理问题先于部署决策。

然而，在商业领域，这一顺序往往是例外而非常态——市场力量奖励速度，治理生态体系尚未跟上。

消息发布当日，《纽约时报》专栏作家托马斯·弗里德曼撰文指出，Mythos Preview所代表的意义，其影响或堪比核武器的出现及核不扩散的必要性，是任何单一组织或国家都无法独立应对的能力挑战。他的判断并无偏差，但文明层面的挑战并不能免除组织层面的责任。今天每个部署AI系统的组织，都面临着Anthropic在Mythos问题上作出回答的同一道题：现有约束基础设施，是否与正在部署的能力水平相匹配？

许多组织目前尚无可靠答案。这并非源于漠视，而是因为作出这一判断所需的框架、标准和监管指引，仍在持续完善之中。

不要拖延决策

玻璃翼计划只是一个开端，它汇聚了多个组织、承担防御使命、投入1亿美元资金，专门针对某一具体威胁。它并不是对其所揭示的更广泛挑战的完整解答。

这一挑战属于每一个构建或部署AI系统的组织。将约束充分性视为部署前提，而非部署后的补救事项；衡量治理文件所规定的要求与AI系统实际行为之间的差距；认识到随着AI能力的持续提升，针对当前能力设计的约束体系需要不断重新评估。

Anthropic的选择展示了一种难能可贵的自律：诚实地回答治理问题，并将答案付诸行动，即便这个答案并不方便。

那些将站在AI历史正确一侧的组织，正是那些现在就在追问这个问题的组织——而不是等到事故发生、答案无可回避之时。

Q&A

Q1：Anthropic为什么不发布Claude Mythos Preview模型？

A：Anthropic认为当前的约束基础设施尚不足以支撑负责任地部署该模型。测试中，Claude Mythos Preview识别出了所有主流操作系统和浏览器中的数千个关键漏洞，其能力一旦落入不当之手，可能危及全球几乎所有主要软件系统。因此，Anthropic选择暂不公开发布，并启动玻璃翼计划，联合50家机构率先修补漏洞。

Q2：玻璃翼计划（Project Glasswing）具体是做什么的？

A：玻璃翼计划是Anthropic发起的一个联合行动，汇聚了50家顶尖科技和关键基础设施机构，投入1亿美元，专注于在AI强大能力扩散至不负责任的主体之前，率先发现并修补系统漏洞。其核心目标是建立充分的网络安全防护机制，确保AI模型危险输出能够被检测和阻断。

Q3：企业在部署AI系统时，应该如何建立有效的AI治理体系？

A：企业应将AI治理视为部署前提而非事后补救。具体做法包括：对所有在用AI系统建立完整台账、依照技术与运营标准进行定期评估、衡量规范要求与实际落地之间的差距，并随系统及环境演变持续复查。治理体系需像DevSecOps或合规管控一样系统化、可审计，而非停留在一纸文件层面。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

AI治理必须先于部署，而非事后补救

来源：SiliconANGLE

2026

05/07

10:20

分享

点赞

依米康泰国接入数据中心温控交付，液冷生产线与焓差实验室补齐制造测试

Salesforce推出Help Agent，简化AI客服部署流程

智能体资源发现协议ARD：谷歌微软等巨头联手解决AI智能体工具管理难题

IBM首次实现亚纳米芯片技术突破，可集成近千亿颗晶体管

当AI包揽数学运算，数学家的意义何在？

生成式AI正在让员工丧失独立思考能力

特朗普签署量子行政令，誓要成为"量子信息科技超级大国"

亚马逊追加130亿美元投资印度AI基础设施

Craig Primack博士：远程医疗如何填补肥胖症诊疗缺口

OpenAI与Broadcom联合推出专为AI推理打造的定制芯片Jalapeno

IBM宣称推出全球首个亚纳米芯片技术

OpenAI 迎来 AI 研究大牛 Noam Shazeer 加盟

AI如何重塑企业软件开发的全流程

GPT-5.5网络安全测试成绩与备受关注的Mythos Preview持平

超大规模云厂商财报显示：AI需求增速持续超越基础设施建设

谷歌与Anthropic达成巨额AI基础设施协议，算力预售规模达吉瓦级别

身份与访问管理工具助力红牛车队应对F1严苛法规

谷歌研究院：以开放科学与全球合作推动科学突破

CISA警告：NSA开发的OT网络工具存在数据窃取漏洞

Databricks版权侵权诉讼难以摆脱，潜在赔偿金额或高达天文数字

卫星搭载AI实时处理地球影像，Planet Labs实现太空智能识别

智能体AI时代来临，企业需重新审视GPU之外的计算选择

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: