三月下旬,Anthropic内容管理系统的一次配置错误意外曝光了该公司正在研发的Claude Mythos——一个能力远超现有旗舰产品Opus的全新模型系列。那份未正式发布的公告还提到,Anthropic将采取更为审慎的发布策略,以降低"网络安全领域潜在的近期风险"。如今,Anthropic正在将这一承诺付诸实践。
Claude Mythos Preview登场,暂不对外开放
Anthropic于周二将Claude Mythos Preview定位为"通用型、尚未正式发布的前沿模型",目前不会面向公众开放——至少以现有形态暂时不会。取而代之的是,Anthropic将通过名为"Glasswing项目"的计划,向少数精选合作伙伴提供访问权限。
亚马逊、苹果、博通、思科、CrowdStrike、Linux基金会、微软以及Palo Alto Networks是该项目的首批启动合作伙伴。这些企业及约40家其他机构将获得Claude Mythos Preview版本的访问权限,专门用于防御性安全工作,包括扫描和加固自身系统及开源工具。
性能亮眼,网络安全基准测试大幅领先
尽管Mythos并非专为网络安全任务设计,但Anthropic指出,该模型在智能体代码编写与推理方面表现出色。在评估AI智能体漏洞分析能力的CyberGym基准测试中,Claude Mythos得分高达83.1%,而此前排名领先的Opus 4.6仅得66.6%。
作为以AI安全为核心使命、作为OpenAI替代方案而创立的公司,Anthropic认为,具备此类能力的模型在发布时应保持足够谨慎,以便防御方在攻击者获取访问权限之前有充足时间强化防线。
当然,也有人持怀疑态度,认为渲染这些风险不过是为了在公众眼中塑造模型"能力超群、令人垂涎"的形象。但CrowdStrike首席技术官Elia Zaitsev指出,这里存在真实的威胁。
"从漏洞被发现到被攻击者利用,这一窗口期已大幅收窄——过去需要数月的事情,如今借助AI只需几分钟,"他在声明中表示,"Claude Mythos Preview展示了防御方在规模化部署上的新可能,而攻击者也必然会试图利用同样的能力。这不是减速的理由,而是携手加速的理由。如果你想部署AI,安全必须先行。"
发现数千个零日漏洞,最古老漏洞潜伏27年
Anthropic已通过Mythos Preview发现了其所描述的"数千个零日漏洞,其中不乏高危漏洞"。其中许多漏洞历史久远,最古老的一个是OpenBSD系统中一个长达27年未被发现、也从未修复的缺陷。
该模型还成功将Linux内核中的多个漏洞串联利用,最终获取了超级用户权限。
开源项目的安全守护者
此类安全研究对开源项目而言尤为重要。Linux基金会执行董事Jim Zemlin表示,安全专业能力在历史上是大型企业才负担得起的资源,中小企业和开源项目往往望尘莫及。
"开源软件维护者所维护的代码支撑着全球大量关键基础设施,但他们在安全问题上历来只能各自为战,"他说,"通过让这些关键开源代码库的维护者获得新一代AI模型的支持——能够主动识别并大规模修复漏洞——Glasswing项目为改变这一现状提供了可行路径。这正是AI增强安全成为每一位维护者可信赖助手的方式,而不仅仅是那些能够负担昂贵安全团队的人的专属特权。"
百万资金支持,Mythos终将面向大众
Anthropic计划最终将Mythos系列模型向所有用户开放,但目前仅限Glasswing项目参与方使用。Anthropic为参与企业提供了价值1亿美元的使用额度,并向开源安全组织直接捐款400万美元。
Q&A
Q1:Claude Mythos和Opus相比,性能提升有多大?
A:在评估AI智能体漏洞分析能力的CyberGym基准测试中,Claude Mythos得分为83.1%,而此前排名第一的Opus 4.6得分仅为66.6%,提升幅度超过16个百分点。Claude Mythos在智能体代码编写与推理方面表现尤为突出,整体能力显著优于Opus系列。
Q2:Glasswing项目具体有哪些参与机构?他们能用Claude Mythos做什么?
A:首批参与机构包括亚马逊、苹果、博通、思科、CrowdStrike、Linux基金会、微软和Palo Alto Networks,加上另外约40家组织,合计约48家机构。这些机构可使用Claude Mythos Preview进行防御性安全工作,例如扫描和加固自身系统及开源工具,目的是在攻击者获得同等能力之前抢先修复漏洞。
Q3:Claude Mythos什么时候会对普通用户开放?
A:目前Anthropic尚未公布具体的公开发布时间表,仅表示"计划最终向所有用户开放Mythos系列模型"。现阶段出于网络安全风险的考量,访问权限仅限Glasswing项目的参与机构,Anthropic希望防御方能在模型广泛普及前做好充分准备。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
复旦大学团队提出ICWM框架,让机器人在任务前通过随机探测动作自主感知当前视角和物理配置,无需重新训练即可适应新摄像头角度,真实机器人测试成功率最高提升175%。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
西安交通大学团队提出Fast-LeWM,用动作前缀并行预测替代逐步推演,将AI世界模型规划速度提升近4倍,同时平均成功率从85.8%提升至90.5%。