Anthropic近期麻烦不断。
上周,《财富》杂志报道了该AI公司在开发新模型Mythos时意外发生的信息泄露事件。不到一周后,Anthropic再度陷入被动——这次是源代码遭到暴露。安全研究员Chaofan Shou发现,该公司在发布Claude Code 2.1.88版本时,npm安装包中附带了一个59.8MB的源码映射文件,外界由此得以完整查看其代码库。
风波并未就此平息。Anthropic随即援引美国数字版权法,要求GitHub下架含有泄露代码的代码仓库。据TechCrunch报道,此次下架操作波及了超过8000个代码仓库。对此,Anthropic发言人将其定性为误操作:"本次下架波及的仓库数量超出了预期范围。"
目前,Anthropic已撤回对其他仓库的下架申请,但这一笨拙的处置方式给公司原本混乱的一周又添上了新的污点。
尽管Anthropic或许希望这一切就此告一段落,但已经打开的潘多拉魔盒难以再次封闭,未来还潜藏着哪些安全隐患,目前尚无定论。
暴露的512,000行代码
随着51.2万行代码曝光,AI社区得以对Claude Code的完整架构一览无余。
i-GENTIC AI联合创始人兼CEO、曾参与世界经济论坛全球AI治理与政策工作的Zahra Timsah博士认为,将此事称为"泄露"过于轻描淡写:"你真正看到的,是该系统思考方式与边界执行机制的结构性暴露,"她对The New Stack表示,"当系统提示、编排逻辑和隐藏标志被公开,你面对的就不再是一个黑箱了。"
除代码库泄露外,外界本周还通过一个未加保护、可公开访问的数据存储,提前窥见了Anthropic正在开发中的新模型Claude Mythos的内部信息。Anthropic发言人向《财富》杂志表示,该模型是"迄今为止我们构建的能力最强的模型",代表着AI性能的"跨越式提升"。
"当系统提示、编排逻辑和隐藏标志被公开,你面对的就不再是一个黑箱了。"——Zahra Timsah,i-GENTIC AI联合创始人兼CEO
《财富》杂志查阅的数据存储中还包含一个名为Capybara的新模型系列的相关信息。据Anthropic内部文件描述,Capybara"比我们迄今最强大的Opus系列模型更大、更智能"。
安全隐患几何?
Anthropic在被《财富》杂志告知后已关闭了该数据存储的公开访问权限,但事件影响已然难以消除,诸多问题值得深思。
首先,此次泄露的源码映射文件暴露了Claude Code的完整架构,将带来怎样的后续影响?The New Stack此前的报道指出:"泄露的源码暴露了Claude Code精确的权限执行逻辑、钩子编排路径,以及它在判断是否执行陌生代码仓库中代码时所依赖的信任边界。"这为恶意行为者利用系统漏洞、绕过安全防护提供了清晰的突破口。
然而,这些不过是眼前的隐患。据Anthropic自身披露,更大的网络安全威胁正在前方等待。
据《财富》杂志最先曝光的一份内部文件显示,Anthropic对其新模型Capybara可能带来的网络安全风险有着清醒的认知,这也是该公司将早期访问权限限定在特定机构的原因所在:"我们希望了解该模型在网络安全领域潜在的近期风险,并将研究结果公开分享,帮助网络安全防御者做好应对准备。"
这些风险源于Anthropic所描述的该模型在网络能力方面的突出进展——其内部文件将其形容为"目前在网络能力方面远超任何其他AI模型"。Anthropic警告称,一旦恶意行为者掌握这些能力,"将预示着一波新模型浪潮的来临,其漏洞利用能力将远超防御者的应对速度"。
"负责任"光环蒙尘
Mythos与Capybara计划的泄露、源代码的曝光,加之GitHub下架事件的失当处理,共同构成了Anthropic的一段尴尬时期。
"Anthropic的品牌定位建立在'负责任的AI公司'这一形象上,而这一形象刚刚受到了重创,"Timsah说道。她认为,该公司在约束模型行为方面投入了大量精力,却在发布流程和基础设施管控上缺乏同等力度的把关:"如果安全领导力只体现在模型层面,你就没有资格以此自居。"
"如果安全领导力只体现在模型层面,你就没有资格以此自居。"——Zahra Timsah,i-GENTIC AI联合创始人兼CEO
数据隐私、AI治理与网络安全咨询公司Aetos Data Consulting联合创始人兼CEO Shayne Adler对此表示赞同,并呼吁建立更为全面的AI治理体系:"构建对AI系统的信任,既有赖于前沿模型的性能表现,同样也依赖于规范、一致的治理机制与变更管控,"Adler对The New Stack表示。
近期,Anthropic一直处于功能密集发布的冲刺阶段(包括上周推出的Claude计算机使用功能),但在这场激烈的竞争中,类似的疏漏似乎难以避免。
对此,Timsah坚持认为,速度不应成为放弃责任的借口。当被问及此类事故是否不可避免时,她毫无余地地表示:"快速发展的AI公司正在优先追求速度,把问责机制留待日后补救。只要公司将产品发布置于合规执行之前,这类事件就会以各种形式反复上演。"
Q&A
Q1:Claude Code源码泄露具体暴露了哪些内容?
A:此次泄露是因Anthropic在发布Claude Code 2.1.88版本时,npm安装包中附带了一个59.8MB的源码映射文件,共暴露了约51.2万行代码。泄露内容涵盖Claude Code的权限执行逻辑、钩子编排路径以及信任边界判断机制,使外界得以完整查看其系统架构,不再是此前的"黑箱"状态,也为恶意行为者提供了可利用的攻击路径。
Q2:Anthropic的新模型Capybara有什么特别之处?
A:据Anthropic内部文件描述,Capybara比现有最强的Opus系列模型更大、更智能,且在网络安全能力方面"远超任何其他AI模型"。正因如此,Anthropic将早期访问权限限定在特定机构,目的是评估其潜在的网络安全风险。Anthropic同时警告,若此类能力落入恶意行为者之手,将引发一波超越防御者应对能力的漏洞利用浪潮。
Q3:Anthropic的GitHub下架操作为什么会误伤8000个代码仓库?
A:Anthropic援引美国数字版权法要求GitHub下架含有泄露代码的仓库,但此次下架操作波及范围远超预期,导致8000余个代码仓库被误删。Anthropic发言人将其定性为操作失误,并已撤回对其他无关仓库的下架申请。此事件进一步暴露了Anthropic在发布流程和基础设施管控上存在的不足。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。