Anthropic扩大Claude Mythos访问权限,警告网络攻击危害可达亿级用户

Anthropic宣布扩大Project Glasswing合作计划,新增约150家合作伙伴,使其可访问强大的Claude Mythos Preview模型。该模型已发现超过1万个高危或严重安全漏洞,涵盖主流操作系统和浏览器。Anthropic警告,一旦遭受成功攻击,可能影响逾1亿人,威胁全球安全。新加入伙伴涵盖电力、医疗、通信等关键行业。尽管该项目受到透明度不足的批评,但业界普遍认为此类协作防御举措势在必行。

Anthropic于近日发出了一则令人警醒的公告。

"一旦攻击成功,后果将是灾难性的。我们估计,对于大多数合作伙伴而言,一次重大攻击可能影响超过1亿人,并对全球及国家安全产生深远影响。"这家AI巨头在公告中写道。

这一警告伴随着Glasswing项目扩展的消息一同发布。Glasswing项目是一项旨在保障全球软件代码资源安全的协作计划,为参与方提供对Claude Mythos Preview的安全、受审批的访问权限。Claude Mythos Preview是Anthropic旗下一系列模型的集合,其能力远超该公司面向公众开放的Opus系列大语言模型。

"AI模型的编程能力已达到一个新高度,除极少数顶尖人类专家外,它们可以在发现和利用软件漏洞方面超越绝大多数人。"——Anthropic

Anthropic于4月7日正式宣布启动Glasswing项目,当时有50家机构获得了其强大AI工具的访问权限。公告中同时指出,"AI模型的编程能力已达到一个新高度,除极少数顶尖人类专家外,它们可以在发现和利用软件漏洞方面超越绝大多数人。"

Glasswing项目的初始核心成员合作伙伴包括亚马逊云科技(AWS)、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks以及Anthropic自身。

近日,Anthropic宣布将向Glasswing项目新增约150家合作伙伴:

"我们正在扩大Glasswing项目的规模。在与现有项目合作伙伴、安全行业、开源软件维护者以及美国政府开展数周深度合作后,我们将伙伴关系扩展至约150家新机构。每一家机构在获得访问权限前,均须满足我们的安全要求。"

这些新加入的机构,连同4月公告时已加入的约50家机构,都将获得Mythos Preview的早期访问权限。Mythos Preview是Anthropic旗下高度先进的AI模型,该公司表示该模型已发现"数千个高危漏洞",其中包括当今"所有主流操作系统和网络浏览器"中的多处漏洞。鉴于AI能力的快速进步,Anthropic预测"不需要多久",此类能力便会扩散,并可能落入不承诺安全部署的行为者手中。

Anthropic深知模型被恶意利用的风险,并从一开始就强调Claude Mythos应用于防范网络风险,而非助长网络风险。Glasswing项目的合作伙伴将这款预发布软件指向各自的代码库,共发现了逾10,000个高危或严重安全漏洞。

Anthropic在近日公告中并未披露新增合作伙伴的具体名称,也未给出精确数字,仅表示约150家。这些机构来自约15个国家,Glasswing项目也旨在进一步扩大其地理覆盖范围。

"本次新增成员涵盖了此前代表性不足的多个行业,例如能源、水务、医疗健康、通信和硬件。其中许多新伙伴是供应商——即维护着被全球众多组织(包括各国政府)所依赖的代码库的企业或非营利机构。"Anthropic表示。

该计划的成立,是对Anthropic"长期以来持续警告"的某种事项的回应——即该团队预计在未来6至12个月内,"许多其他AI公司"将拥有与Mythos同级别的模型,而这些模型当然可能在没有任何防滥用安全措施的情况下发布。

"我们将自身角色定位为两个方面,"Anthropic表示,"其一,通过安全地为更广泛的群体提供更强大的模型、工具和通用基础设施,帮助软件行业完成适应;其二,逐步将我们提供的支持从发现漏洞,转向披露漏洞、修复漏洞以及部署修补后的软件。"

据悉,Glasswing项目启动后的最初几周,尽管被描述为真正意义上的协作,各参与方仍在与第三方合作对模型的发现结果进行分类处理的同时,积极与其他合作伙伴分享信息与最佳实践。这些最佳实践旨在建立可被其他机构"广泛复制"的方法论,以帮助它们适应此类新型工具。

为支持其在该领域的工作,Anthropic还于今年2月发布了Claude Security服务。该服务调用公司最新的公开前沿模型(包括Claude Opus 4.8)扫描代码库并给出修复建议。"我们还将向受信任的安全团队——按需求——开放我们为帮助Glasswing项目合作伙伴更快速定位漏洞而开发的工具。"Anthropic表示。

正如Anthropic所说,公司目前将网络安全的瓶颈视为如何高效验证、披露和修补Mythos级别模型所能发现的大量漏洞这一问题。

在超强AI模型的竞赛持续推进之际,OpenAI于5月7日作为其"网络可信访问"(TAC)计划的一部分发布了GPT-5.5-Cyber,并于4月14日进一步扩大规模,承诺"专门针对防御性网络安全应用场景对模型进行微调"。

OpenAI为这一举措背书,并表示其扩大网络防御规模的方式将"与模型能力的提升保持同步",以指导未来版本的测试与部署。

"Anthropic的Glasswing项目采用的是与开放式同行评审标准完全相反的模式。它自行选择哪些发现需要提交独立审查,而审查人员是受雇的外包人员。这不是第三方验证,这是自我编辑。"——Justin Beals,Strike Graph

AI原生GRC与合规管理平台Strike Graph的CEO兼创始人Justin Beals在接受媒体采访时表示,他认为对前沿AI进行受控推出是正确的本能反应,但他对漏洞的评估与分析方式表达了担忧。

"工程界花了数年时间,建立起了用于评估和信任软件的开放式同行评审标准,"Beals说,"而Anthropic的Glasswing项目却采用了截然相反的模式。它自行选择哪些发现需要提交独立审查,审查人员又是被雇来的外包人员。这不是第三方验证,而是自我编辑。"

Beals希望更广泛的安全社区能够参与其中,并获得针对完整代码库的独立第三方评估权限。

"在这些模型之上构建产品的开发者,需要了解他们实际集成的是什么,而不是Anthropic决定分享的摘要内容。随着前沿模型渗透到技术栈的更深层,不透明的安全声明所积累的技术债务将持续累积。对于任何具有如此重大影响力的基础设施而言,标准应当是可验证的透明度,而非精心筛选过的收据。"Beals进一步阐明了自己的立场。

在获得广泛认可的同时,业界也期待一种更为开放和均衡的方式。Futurum集团分析师Guy Currier表示,如果我们曾以为无人机是自动化战争的前沿,那我们就错了。

"软件是同样先进的战场,网络威胁不遵守任何日内瓦公约,而且广泛渗透于企业、公共、个人和政治领域,而不仅仅局限于军事范畴,"Currier说,"Mythos有过失误,Glasswing项目也面临合理批评(缺乏透明度、自我监管),但这件事必须从更广泛的层面推进,而且越快越好。Anthropic的领导力值得肯定,也切实有益,符合其品牌调性。"

展望未来,Anthropic对Glasswing项目以及未来可能出现的类似举措抱有更大的愿景。

"我们正与第三方就如何大幅扩展开源软件漏洞的审查与修补工作展开讨论。我们也在积极探索如何与开源维护者分享漏洞披露的理念与最佳实践,以使这些报告更易于分类和处理。"Anthropic在公告中表示。

Mythos Preview还可用于渗透测试(模拟网络攻击以识别漏洞可能被利用的方式)、自动化威胁检测与响应,以及将遗留代码库重构为内存安全语言等众多防御性任务。

Anthropic表示,公司有一个"长远目标",即支持行业在强大网络模型时代构建新的计划、标准和基础设施。

Q&A

Q1:Glasswing项目是什么?它的主要目标是什么?

A:Glasswing项目是由Anthropic发起的全球软件代码安全协作计划,旨在为参与机构提供对Claude Mythos Preview模型的安全访问权限,帮助各方发现和修复软件漏洞。该项目最初有50家机构参与,近期又新增约150家合作伙伴,成员来自约15个国家,涵盖能源、水务、医疗、通信、硬件等多个行业。

Q2:Claude Mythos在网络安全方面有哪些具体成果?

A:Claude Mythos Preview已在合作伙伴的代码库中发现了逾10,000个高危或严重安全漏洞,其中包括存在于当今所有主流操作系统和网络浏览器中的多处漏洞。Anthropic表示,该模型的编程能力已能超越绝大多数人类专家,可用于漏洞发现、渗透测试、自动化威胁检测响应以及将遗留代码库重构为内存安全语言等任务。

Q3:Glasswing项目受到了哪些批评?

A:Strike Graph CEO Justin Beals对该项目的透明度表示质疑,他认为Glasswing项目采用的是与开放式同行评审标准相反的模式——Anthropic自行决定哪些发现提交独立审查,且审查人员为外包人员,这并非真正意义上的第三方验证。他呼吁更广泛的安全社区参与,并对完整代码库进行独立评估,以实现真正可验证的透明度。

来源:The New Stack

0赞

好文章,需要你的鼓励

2026

06/12

13:50

分享

点赞

邮件订阅