由于Anthropic PBC内容管理系统的配置错误,意外曝光了该公司正在测试名为Claude Mythos的新大语言模型。
该公司在周四向《财富》杂志发表声明确认了这一项目。据该公司表示,其工程师已完成Claude Mythos的训练,目前正与早期客户进行试点测试。Anthropic补充说,这个大语言模型是"我们迄今为止构建的最强大模型"。
Mythos的曝光源于该公司意外将包含3000个资源的CMS文件夹设为公开访问。该存储库包含Claude Mythos发布博客文章的草稿版本。据《财富》杂志报道,文档显示该模型的定价将高于该公司现有的算法。
博客文章还透露,Anthropic计划改变其大语言模型的分发方式。Claude 4.6是该公司目前的旗舰模型,提供三个具有不同功能和定价的版本。Anthropic将在推出Claude Mythos时增加第四个产品层级。
据报道,新的大语言模型版本将比Anthropic目前顶级产品层级Opus更昂贵、功能更强大。草稿博客文章将即将推出的产品称为Capybara。Anthropic的内部测试表明,Mythos的Capybara版本在编程任务和其他推理用例方面"显著"优于Claude 4.6 Opus。
Capybara在发现网络安全漏洞方面特别擅长。因此,Anthropic将采取预防措施,防止黑客访问该模型。
草稿文章写道,该模型"预示着即将到来的模型浪潮,这些模型能够以远超防御者努力的方式利用漏洞"。"我们将向组织提供早期访问权限,让他们在即将到来的AI驱动漏洞利用浪潮中抢先改善其代码库的健壮性。"
CrowdStrike Holdings Inc.、Palo Alto Networks Inc.和其他主要网络安全提供商的股价在消息传出后下跌超过5%。投资者可能担心Capybara可能为Anthropic在漏洞检测市场提供竞争优势。该公司上个月通过发布名为Claude Code Security的工具进入了这一领域。
该工具目前由Claude Opus 4.6驱动,在发现漏洞方面表现出色。Anthropic工程师已使用它在开源项目中发现了500多个高危漏洞。有一次,该模型通过分析开发者在变更日志中的注释,推断出PDF工具中存在缺陷。
Claude Mythos的披露正值OpenAI Group PBC完成其最新大语言模型预训练的消息传出几天后。预训练是开发工作流程中工程师构建模型核心能力的阶段。随后进行的小规模优化主要专注于改善大语言模型的硬件效率、安全性和可用性。
据报道,OpenAI的新模型在内部被称为Spud。该公司预计将在几周内推出该模型。
Q&A
Q1:Claude Mythos是什么?它有什么特别之处?
A:Claude Mythos是Anthropic公司正在测试的新大语言模型,该公司称其为"迄今为止构建的最强大模型"。它具备高级推理功能,在编程任务和网络安全漏洞检测方面表现突出,特别是其Capybara版本在这些任务上显著优于现有的Claude 4.6 Opus模型。
Q2:Capybara版本有什么特殊能力?为什么需要限制访问?
A:Capybara是Claude Mythos的高端版本,特别擅长发现网络安全漏洞。由于该模型能够以远超防御者努力的方式利用漏洞,Anthropic担心被黑客滥用,因此将采取预防措施限制访问,只向组织提供早期访问权限。
Q3:Claude Mythos的发布对网络安全行业有什么影响?
A:Claude Mythos的披露导致CrowdStrike、Palo Alto Networks等主要网络安全公司股价下跌超过5%。投资者担心Anthropic可能在漏洞检测市场获得竞争优势,特别是考虑到该公司已通过Claude Code Security工具进入网络安全领域。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。