由于Anthropic PBC内容管理系统的配置错误,意外曝光了该公司正在测试名为Claude Mythos的新大语言模型。
该公司在周四向《财富》杂志发表声明确认了这一项目。据该公司表示,其工程师已完成Claude Mythos的训练,目前正与早期客户进行试点测试。Anthropic补充说,这个大语言模型是"我们迄今为止构建的最强大模型"。
Mythos的曝光源于该公司意外将包含3000个资源的CMS文件夹设为公开访问。该存储库包含Claude Mythos发布博客文章的草稿版本。据《财富》杂志报道,文档显示该模型的定价将高于该公司现有的算法。
博客文章还透露,Anthropic计划改变其大语言模型的分发方式。Claude 4.6是该公司目前的旗舰模型,提供三个具有不同功能和定价的版本。Anthropic将在推出Claude Mythos时增加第四个产品层级。
据报道,新的大语言模型版本将比Anthropic目前顶级产品层级Opus更昂贵、功能更强大。草稿博客文章将即将推出的产品称为Capybara。Anthropic的内部测试表明,Mythos的Capybara版本在编程任务和其他推理用例方面"显著"优于Claude 4.6 Opus。
Capybara在发现网络安全漏洞方面特别擅长。因此,Anthropic将采取预防措施,防止黑客访问该模型。
草稿文章写道,该模型"预示着即将到来的模型浪潮,这些模型能够以远超防御者努力的方式利用漏洞"。"我们将向组织提供早期访问权限,让他们在即将到来的AI驱动漏洞利用浪潮中抢先改善其代码库的健壮性。"
CrowdStrike Holdings Inc.、Palo Alto Networks Inc.和其他主要网络安全提供商的股价在消息传出后下跌超过5%。投资者可能担心Capybara可能为Anthropic在漏洞检测市场提供竞争优势。该公司上个月通过发布名为Claude Code Security的工具进入了这一领域。
该工具目前由Claude Opus 4.6驱动,在发现漏洞方面表现出色。Anthropic工程师已使用它在开源项目中发现了500多个高危漏洞。有一次,该模型通过分析开发者在变更日志中的注释,推断出PDF工具中存在缺陷。
Claude Mythos的披露正值OpenAI Group PBC完成其最新大语言模型预训练的消息传出几天后。预训练是开发工作流程中工程师构建模型核心能力的阶段。随后进行的小规模优化主要专注于改善大语言模型的硬件效率、安全性和可用性。
据报道,OpenAI的新模型在内部被称为Spud。该公司预计将在几周内推出该模型。
Q&A
Q1:Claude Mythos是什么?它有什么特别之处?
A:Claude Mythos是Anthropic公司正在测试的新大语言模型,该公司称其为"迄今为止构建的最强大模型"。它具备高级推理功能,在编程任务和网络安全漏洞检测方面表现突出,特别是其Capybara版本在这些任务上显著优于现有的Claude 4.6 Opus模型。
Q2:Capybara版本有什么特殊能力?为什么需要限制访问?
A:Capybara是Claude Mythos的高端版本,特别擅长发现网络安全漏洞。由于该模型能够以远超防御者努力的方式利用漏洞,Anthropic担心被黑客滥用,因此将采取预防措施限制访问,只向组织提供早期访问权限。
Q3:Claude Mythos的发布对网络安全行业有什么影响?
A:Claude Mythos的披露导致CrowdStrike、Palo Alto Networks等主要网络安全公司股价下跌超过5%。投资者担心Anthropic可能在漏洞检测市场获得竞争优势,特别是考虑到该公司已通过Claude Code Security工具进入网络安全领域。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
Salesforce正式推出Help Agent,这是基于Agentforce平台的预封装AI客服智能体,可在数分钟内连接企业知识库、操作功能及网页、短信、语音等沟通渠道。该产品同步推出按解决率计费模式,每次成功自主解决客户问题收费2美元,无需按token或操作次数计费。Help Agent支持低代码构建,内置测试功能,并配备全新客户服务门户。该产品预计于2026年7月正式上线。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。