Anthropic多事之秋:模型泄露、源码暴露与GitHub下架风波

Anthropic近期接连遭遇多起信息安全事故:新模型Mythos开发计划意外泄露,Claude Code 2.1.88版本随npm包附带近60MB源码映射文件,导致51.2万行代码完全暴露。此后,Anthropic援引美国数字版权法要求GitHub下架相关仓库,却误删超8000个无关仓库。专家指出,此次事件暴露了Anthropic在发布流程与基础设施管控上的不足,"安全领导者"的定位因此受损。

Anthropic近期麻烦不断。

上周,《财富》杂志报道了该AI公司在开发新模型Mythos时意外发生的信息泄露事件。不到一周后,Anthropic再度陷入被动——这次是源代码遭到暴露。安全研究员Chaofan Shou发现,该公司在发布Claude Code 2.1.88版本时,npm安装包中附带了一个59.8MB的源码映射文件,外界由此得以完整查看其代码库。

风波并未就此平息。Anthropic随即援引美国数字版权法,要求GitHub下架含有泄露代码的代码仓库。据TechCrunch报道,此次下架操作波及了超过8000个代码仓库。对此,Anthropic发言人将其定性为误操作:"本次下架波及的仓库数量超出了预期范围。"

目前,Anthropic已撤回对其他仓库的下架申请,但这一笨拙的处置方式给公司原本混乱的一周又添上了新的污点。

尽管Anthropic或许希望这一切就此告一段落,但已经打开的潘多拉魔盒难以再次封闭,未来还潜藏着哪些安全隐患,目前尚无定论。

暴露的512,000行代码

随着51.2万行代码曝光,AI社区得以对Claude Code的完整架构一览无余。

i-GENTIC AI联合创始人兼CEO、曾参与世界经济论坛全球AI治理与政策工作的Zahra Timsah博士认为,将此事称为"泄露"过于轻描淡写:"你真正看到的,是该系统思考方式与边界执行机制的结构性暴露,"她对The New Stack表示,"当系统提示、编排逻辑和隐藏标志被公开,你面对的就不再是一个黑箱了。"

除代码库泄露外,外界本周还通过一个未加保护、可公开访问的数据存储,提前窥见了Anthropic正在开发中的新模型Claude Mythos的内部信息。Anthropic发言人向《财富》杂志表示,该模型是"迄今为止我们构建的能力最强的模型",代表着AI性能的"跨越式提升"。

"当系统提示、编排逻辑和隐藏标志被公开,你面对的就不再是一个黑箱了。"——Zahra Timsah,i-GENTIC AI联合创始人兼CEO

《财富》杂志查阅的数据存储中还包含一个名为Capybara的新模型系列的相关信息。据Anthropic内部文件描述,Capybara"比我们迄今最强大的Opus系列模型更大、更智能"。

安全隐患几何?

Anthropic在被《财富》杂志告知后已关闭了该数据存储的公开访问权限,但事件影响已然难以消除,诸多问题值得深思。

首先,此次泄露的源码映射文件暴露了Claude Code的完整架构,将带来怎样的后续影响?The New Stack此前的报道指出:"泄露的源码暴露了Claude Code精确的权限执行逻辑、钩子编排路径,以及它在判断是否执行陌生代码仓库中代码时所依赖的信任边界。"这为恶意行为者利用系统漏洞、绕过安全防护提供了清晰的突破口。

然而,这些不过是眼前的隐患。据Anthropic自身披露,更大的网络安全威胁正在前方等待。

据《财富》杂志最先曝光的一份内部文件显示,Anthropic对其新模型Capybara可能带来的网络安全风险有着清醒的认知,这也是该公司将早期访问权限限定在特定机构的原因所在:"我们希望了解该模型在网络安全领域潜在的近期风险,并将研究结果公开分享,帮助网络安全防御者做好应对准备。"

这些风险源于Anthropic所描述的该模型在网络能力方面的突出进展——其内部文件将其形容为"目前在网络能力方面远超任何其他AI模型"。Anthropic警告称,一旦恶意行为者掌握这些能力,"将预示着一波新模型浪潮的来临,其漏洞利用能力将远超防御者的应对速度"。

"负责任"光环蒙尘

Mythos与Capybara计划的泄露、源代码的曝光,加之GitHub下架事件的失当处理,共同构成了Anthropic的一段尴尬时期。

"Anthropic的品牌定位建立在'负责任的AI公司'这一形象上,而这一形象刚刚受到了重创,"Timsah说道。她认为,该公司在约束模型行为方面投入了大量精力,却在发布流程和基础设施管控上缺乏同等力度的把关:"如果安全领导力只体现在模型层面,你就没有资格以此自居。"

"如果安全领导力只体现在模型层面,你就没有资格以此自居。"——Zahra Timsah,i-GENTIC AI联合创始人兼CEO

数据隐私、AI治理与网络安全咨询公司Aetos Data Consulting联合创始人兼CEO Shayne Adler对此表示赞同,并呼吁建立更为全面的AI治理体系:"构建对AI系统的信任,既有赖于前沿模型的性能表现,同样也依赖于规范、一致的治理机制与变更管控,"Adler对The New Stack表示。

近期,Anthropic一直处于功能密集发布的冲刺阶段(包括上周推出的Claude计算机使用功能),但在这场激烈的竞争中,类似的疏漏似乎难以避免。

对此,Timsah坚持认为,速度不应成为放弃责任的借口。当被问及此类事故是否不可避免时,她毫无余地地表示:"快速发展的AI公司正在优先追求速度,把问责机制留待日后补救。只要公司将产品发布置于合规执行之前,这类事件就会以各种形式反复上演。"

Q&A

Q1:Claude Code源码泄露具体暴露了哪些内容?

A:此次泄露是因Anthropic在发布Claude Code 2.1.88版本时,npm安装包中附带了一个59.8MB的源码映射文件,共暴露了约51.2万行代码。泄露内容涵盖Claude Code的权限执行逻辑、钩子编排路径以及信任边界判断机制,使外界得以完整查看其系统架构,不再是此前的"黑箱"状态,也为恶意行为者提供了可利用的攻击路径。

Q2:Anthropic的新模型Capybara有什么特别之处?

A:据Anthropic内部文件描述,Capybara比现有最强的Opus系列模型更大、更智能,且在网络安全能力方面"远超任何其他AI模型"。正因如此,Anthropic将早期访问权限限定在特定机构,目的是评估其潜在的网络安全风险。Anthropic同时警告,若此类能力落入恶意行为者之手,将引发一波超越防御者应对能力的漏洞利用浪潮。

Q3:Anthropic的GitHub下架操作为什么会误伤8000个代码仓库?

A:Anthropic援引美国数字版权法要求GitHub下架含有泄露代码的仓库,但此次下架操作波及范围远超预期,导致8000余个代码仓库被误删。Anthropic发言人将其定性为操作失误,并已撤回对其他无关仓库的下架申请。此事件进一步暴露了Anthropic在发布流程和基础设施管控上存在的不足。

来源:The New Stack

0赞

好文章,需要你的鼓励

2026

04/16

10:54

分享

点赞

邮件订阅