Anthropic PBC今日宣布发布其迄今为止开发的最强大前沿模型预览版,该模型将提供给少数合作伙伴和网络安全研究人员,用于帮助保护全球软件安全。
这个名为Claude Mythos的模型作为新网络安全倡议Project Glasswing项目的一部分发布,将有超过40个合作伙伴专门将其用于"防御性安全工作"。据Anthropic表示,尽管Mythos最初并非为安全目的而训练,但它在识别专有和开源软件代码漏洞方面表现出色。
该公司表示不会向公众发布Mythos,因为它"过于强大",公开发布风险太大。
Claude Mythos首次于今年3月在《财富》杂志曝光的泄露信息中被披露。根据该报告,泄露细节描述Mythos比Anthropic现有的Claude Opus模型"更大、更智能",而Claude Opus是其目前最强大的公开可用产品。Mythos最初被设计为Claude的通用模型,具有极强的编码和推理能力,能够执行构建AI智能体和编写代码等任务。
Anthropic表示谨慎是必要的,因为"我们在Mythos预览版中观察到的能力可能重塑网络安全"。在过去几周测试Mythos期间,该公司表示已在网站和应用程序中识别出"数千个漏洞",包括当今使用的每个主要操作系统和网络浏览器。
Project Glasswing的合作伙伴组织包括亚马逊公司、苹果公司、博通公司、思科系统公司、CrowdStrike控股公司、Linux基金会、微软公司和Palo Alto Networks公司。此外,还将向约40个构建或维护"关键软件基础设施"的其他组织提供访问权限。
合作伙伴将与整个技术社区分享他们使用Mythos的学习成果,以便所有人都能从中受益并开发更安全的软件,Anthropic表示。为促进合作伙伴的研究,Anthropic已向Project Glasswing承诺1亿美元的使用积分,因此这些合作伙伴无需为其安全测试和研究支付应用程序编程接口费用。
据报道,该公司还与美国政府官员就给予他们Mythos访问权限进行"持续讨论",尽管这些谈判可能因公司与白宫的持续法律纠纷而复杂化。这是因为Anthropic最近被标记为"供应链风险",原因是拒绝让五角大楼将Claude用于自主武器瞄准或大规模监控。
关于Mythos的能力,Anthropic解释说,它最近在FFmpeg中发现了一个存在16年的漏洞,FFmpeg被数百个应用程序用于编码和解码视频。该漏洞在一行代码中被发现,而这行代码已被传统安全工具扫描超过500万次却从未被发现。更严重的是,Mythos还强大到足以立即为其发现的漏洞开发复杂的攻击代码,潜在地允许攻击者立即利用并开始造成损害。
但尽管Mythos可能极其危险,它也可以用于善事。思科首席安全和信任官Anthony Grieco表示,他的团队一直在使用该模型"以前所未有的速度和规模"查找和修复硬件和软件的安全漏洞。他说这代表了"深刻转变和明确信号,表明加固系统的旧方法不再足够"。
Anthropic表示其最终目标是使Mythos级别的模型能够由公众大规模部署,但要实现这一点,需要开发能够检测和阻止其最危险输出的网络安全防护措施。
如果这些防护措施能够得到构建和验证,Mythos将对软件开发人员特别有用。在衡量AI模型编码能力的SWE-bench Verified基准测试中,Mythos能够解决93.9%的所有问题,远高于Claude Opus 4.6的80.8%准确率。此外,Mythos在更具挑战性的SWE-bench Pro评估中达到77.8%的准确率,而Opus 4.6仅为53.4%。
Q&A
Q1:Claude Mythos模型有什么特殊能力?
A:Claude Mythos是Anthropic开发的最强大前沿模型,在识别专有和开源软件代码漏洞方面表现出色。它具有极强的编码和推理能力,能够执行构建AI智能体和编写代码等任务,在SWE-bench Verified基准测试中达到93.9%的准确率。
Q2:为什么Anthropic不向公众发布Mythos模型?
A:Anthropic认为Mythos模型"过于强大",公开发布风险太大。该模型不仅能发现漏洞,还能立即为发现的漏洞开发复杂的攻击代码,可能被攻击者立即利用造成损害。公司需要先开发网络安全防护措施来检测和阻止其最危险的输出。
Q3:Project Glasswing项目包括哪些合作伙伴?
A:Project Glasswing项目包括超过40个合作伙伴,主要包括亚马逊、苹果、博通、思科、CrowdStrike、Linux基金会、微软和Palo Alto Networks等知名公司。Anthropic为此项目承诺了1亿美元的使用积分,合作伙伴无需支付API费用进行安全测试和研究。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。