Anthropic发布Claude Fable 5:与Mythos同源但内置安全防护机制

Anthropic正式推出Claude Fable 5,该模型与高度限制级别的Mythos共享相同底层架构,但附加了安全防护机制,屏蔽网络安全和生物学等高风险领域的响应。当触发高风险提示时,模型将自动降级至Opus 4.8处理。Fable 5定价为每百万输入token 10美元、输出50美元,约为Opus 4.8的两倍。6月22日前,Pro、Max等订阅用户可免费使用,此后需消耗额度。

Anthropic近日宣布推出其旗舰大语言模型Mythos的"降权版本"——Claude Fable 5。该公司将其定位为"适合大众使用的Mythos级别模型",通过内置安全防护机制,使这一强大的底层模型得以面向更广泛的用户群体开放。

Mythos的背景

Mythos模型于今年4月正式亮相,凭借其在代码漏洞挖掘方面的卓越能力引发业界广泛关注——它能够识别出经验丰富的开发者和其他AI模型都无法发现的安全漏洞。由于能力过于强大,Mythos被认为存在较高的滥用风险,因此仅向参与"玻璃翼计划"(Project Glasswing)的合作伙伴开放,包括亚马逊云服务、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达以及Palo Alto Networks等机构。

从预览版到正式版

此前,Mythos一直以预览产品形式提供。此次Anthropic正式推出Claude Mythos 5,所有拥有Mythos预览版访问权限的用户均可使用。Anthropic表示将通过更系统化的可信访问计划逐步扩大用户范围,但目前尚未披露Mythos预览版与Mythos 5之间的具体差异,后者看起来更像是预览版的正式发布版本。

Fable 5的安全机制

Fable 5与Mythos共用相同的底层模型,但额外增加了安全防护层,专门屏蔽网络安全和生物领域中特定高风险类别的响应内容。值得关注的是,生物领域的限制措辞引发了外界猜测——这意味着Anthropic在实际使用日志中可能已观察到与生物武器相关的提示或响应内容。

当Fable 5检测到提示内容触及上述高风险领域时,模型会自动降级至Opus 4.8进行处理。自Opus 4.7版本起,Anthropic已封锁"几乎专用于恶意目的且几乎没有合法防御用途的活动,例如大规模数据窃取或勒索软件代码开发"。持有Anthropic安全许可的专业人员,可通过网络安全核验计划使用Opus 4.7和4.8执行受限操作。目前尚不明确该计划认证用户是否同样可以在Fable 5上执行受限查询。

Anthropic对Fable 5的安全性表现颇具信心,并公布了相关数据:超过95%的Fable会话完全在Fable自身响应范围内运行,无需触发降级机制;在超过1000小时的内部漏洞悬赏测试和外部红队测试中,均未发现可绕过所有限制的通用越狱方法。

用户反馈与实际体验

尽管官方尚未披露Fable 5的详细技术信息,但已有多位早期用户给出了积极评价。

低代码平台Base44的代表表示:"Fable在一次性生成完整应用方面表现出色,工具调用能力也非常优秀。"

AI工作空间平台Genspark的代表称:"Fable在我们的评测中排名第一,在所有测试模型的正面对比中全面胜出,尤其在最难的任务——UI设计和游戏编程方面表现显著更强。"

电商平台乐天的代表则表示:"在最高处理强度下,Fable会对自身输出进行反思与验证,这正是实现高度自主运营的关键所在——额外的思考过程物有所值。"

定价与访问计划

Fable 5与Mythos 5的定价为:输入Token每百万10美元,输出Token每百万50美元,约为Claude Opus 4.8价格的两倍。

Anthropic针对Fable 5制定了特殊的分阶段推出计划:即日起至6月22日,Pro、Max、Team及按席位计费的企业版用户均可免费使用Fable 5;6月23日起,上述计划将移除Fable 5,后续使用需消耗用量积分;Anthropic表示将尽快将Fable 5重新纳入标准订阅计划。

在命名寓意方面,Anthropic未作官方解释。参照词典释义,"Mythos"指解释世界起源与文化价值观的神圣叙事体系,而"Fable"则指旨在传达道德教训的短篇虚构故事——这一命名逻辑颇耐人寻味。

Q&A

Q1:Claude Fable 5和Mythos有什么区别?

A:Claude Fable 5与Mythos共用相同的底层大语言模型,主要区别在于Fable 5额外增加了安全防护层,会屏蔽网络安全和生物等高风险领域的相关响应。当用户提问触及这些领域时,模型会自动降级至Opus 4.8处理。简单来说,Mythos是面向受信任合作伙伴的完整版,Fable 5是面向大众用户的安全增强版。

Q2:Claude Fable 5的价格是多少?普通用户能用吗?

A:Fable 5定价为输入Token每百万10美元、输出Token每百万50美元,约为Opus 4.8的两倍。现阶段(至6月22日),Pro、Max、Team及企业版用户可免费使用;6月23日起需消耗用量积分;Anthropic后续计划将其重新纳入标准订阅计划。

Q3:Claude Fable 5能防止被恶意利用吗?

A:Anthropic公布的数据显示,超过95%的Fable会话无需触发安全降级机制,且在超过1000小时的内外部红队测试中均未发现通用越狱方法。此外,涉及网络安全和生物等高风险领域的请求会自动降级至Opus 4.8处理,内置多层防护机制,整体安全性较为可靠。

来源:ZDNET

0赞

好文章,需要你的鼓励

2026

06/10

13:09

分享

点赞

邮件订阅