由于Anthropic PBC内容管理系统的配置错误,意外曝光了该公司正在测试名为Claude Mythos的新大语言模型。
该公司在周四向《财富》杂志发表声明确认了这一项目。据该公司表示,其工程师已完成Claude Mythos的训练,目前正与早期客户进行试点测试。Anthropic补充说,这个大语言模型是"我们迄今为止构建的最强大模型"。
Mythos的曝光源于该公司意外将包含3000个资源的CMS文件夹设为公开访问。该存储库包含Claude Mythos发布博客文章的草稿版本。据《财富》杂志报道,文档显示该模型的定价将高于该公司现有的算法。
博客文章还透露,Anthropic计划改变其大语言模型的分发方式。Claude 4.6是该公司目前的旗舰模型,提供三个具有不同功能和定价的版本。Anthropic将在推出Claude Mythos时增加第四个产品层级。
据报道,新的大语言模型版本将比Anthropic目前顶级产品层级Opus更昂贵、功能更强大。草稿博客文章将即将推出的产品称为Capybara。Anthropic的内部测试表明,Mythos的Capybara版本在编程任务和其他推理用例方面"显著"优于Claude 4.6 Opus。
Capybara在发现网络安全漏洞方面特别擅长。因此,Anthropic将采取预防措施,防止黑客访问该模型。
草稿文章写道,该模型"预示着即将到来的模型浪潮,这些模型能够以远超防御者努力的方式利用漏洞"。"我们将向组织提供早期访问权限,让他们在即将到来的AI驱动漏洞利用浪潮中抢先改善其代码库的健壮性。"
CrowdStrike Holdings Inc.、Palo Alto Networks Inc.和其他主要网络安全提供商的股价在消息传出后下跌超过5%。投资者可能担心Capybara可能为Anthropic在漏洞检测市场提供竞争优势。该公司上个月通过发布名为Claude Code Security的工具进入了这一领域。
该工具目前由Claude Opus 4.6驱动,在发现漏洞方面表现出色。Anthropic工程师已使用它在开源项目中发现了500多个高危漏洞。有一次,该模型通过分析开发者在变更日志中的注释,推断出PDF工具中存在缺陷。
Claude Mythos的披露正值OpenAI Group PBC完成其最新大语言模型预训练的消息传出几天后。预训练是开发工作流程中工程师构建模型核心能力的阶段。随后进行的小规模优化主要专注于改善大语言模型的硬件效率、安全性和可用性。
据报道,OpenAI的新模型在内部被称为Spud。该公司预计将在几周内推出该模型。
Q&A
Q1:Claude Mythos是什么?它有什么特别之处?
A:Claude Mythos是Anthropic公司正在测试的新大语言模型,该公司称其为"迄今为止构建的最强大模型"。它具备高级推理功能,在编程任务和网络安全漏洞检测方面表现突出,特别是其Capybara版本在这些任务上显著优于现有的Claude 4.6 Opus模型。
Q2:Capybara版本有什么特殊能力?为什么需要限制访问?
A:Capybara是Claude Mythos的高端版本,特别擅长发现网络安全漏洞。由于该模型能够以远超防御者努力的方式利用漏洞,Anthropic担心被黑客滥用,因此将采取预防措施限制访问,只向组织提供早期访问权限。
Q3:Claude Mythos的发布对网络安全行业有什么影响?
A:Claude Mythos的披露导致CrowdStrike、Palo Alto Networks等主要网络安全公司股价下跌超过5%。投资者担心Anthropic可能在漏洞检测市场获得竞争优势,特别是考虑到该公司已通过Claude Code Security工具进入网络安全领域。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。