Anthropic发布Claude Sonnet 5大语言模型，编程能力与安全性双升级

Anthropic正式推出中端大语言模型Claude Sonnet 5，其编程能力在SWE-Bench Pro和Terminal-Bench 2.1两项基准测试中分别提升5.1%和13.4%。该模型具备更强自主性，能主动核查输出结果，并在抵御恶意请求和提示注入攻击方面表现更优。Sonnet 5将成为Claude免费版和Pro版的默认模型，定价为每百万输入token 3美元。此外，此前因美国出口管制而暂停推出的Mythos 5和Fable 5模型，管制已解除，将于近期恢复访问。

Anthropic今日正式发布了Claude Sonnet 5，这是一款中端大语言模型，在多个维度上超越了前代产品。

该模型将成为Anthropic旗下Claude聊天服务消费级套餐的默认选项。

Anthropic的商用大语言模型产品线分为三个系列：入门级的Haiku系列、中端的Sonnet系列，以及高端的Opus系列。今年4月，该公司推出了两款能力更强的大语言模型Mythos 5和Fable 5，性能甚至超越了Opus系列，但目前尚未向大众开放。

在编程能力方面，Anthropic使用SWE-Bench Pro和Terminal-Bench 2.1两项基准测试对Sonnet 5进行了评估。与前代产品相比，该模型的得分分别提升了5.1%和13.4%。不过，OpenAI旗下同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上的表现仍领先Sonnet 5约4%。

Anthropic还对新模型在其他领域的表现进行了测试。在涵盖44个职业知识工作任务的GDPval-AA v2基准测试中，Sonnet 5获得了1618分，而上一代Sonnet 4.5仅得1395分。

Sonnet 5输出质量提升的一个重要原因在于其自主性更强。据Anthropic介绍，参与发布前测试的用户反馈，该模型有时会在未收到指令的情况下主动对输出结果进行二次核查。此外，Sonnet 5还能够处理前代模型难以应对的复杂任务。

大语言模型自主性的增强在某些场景下可能带来网络安全风险。Anthropic表示，Sonnet 5在应对此类风险方面优于Sonnet 4.6，尤其是在拦截恶意请求和提示词注入攻击方面表现更为出色。所谓提示词注入攻击，是指隐藏在大语言模型所分析数据中的恶意指令。

新模型内置了相应的防护机制，可阻止黑客利用其发动网络攻击。据Anthropic透露，由于该模型无法生成可实际运行的漏洞利用代码，因此其带来的网络安全风险十分有限。

Sonnet 5现已成为Claude聊天服务免费版和面向消费者的Pro套餐的默认模型，未来还将向Max、Team和企业版套餐用户开放。开发者则可通过Anthropic的应用程序编程接口调用该模型。自9月起，Sonnet 5的定价为每百万输入Token 3美元、每百万输出Token 15美元，略高于OpenAI的中端产品Terra。

Anthropic用户即将获得另外两款新模型的访问权限。本月早些时候，该公司发布了旗舰大语言模型Mythos 5及其精简版Fable 5，后者内置了更严格的防护机制，可屏蔽潜在风险提示词。

Mythos 5和Fable 5发布数日后，美国政府对这两款模型实施了出口管制，Anthropic随即暂停了相关模型的推广。该公司今日宣布，上述管制已被解除，相关访问权限将于周三起逐步恢复。Anthropic计划将Fable 5向大众广泛开放，而Mythos 5则仅向有限数量的受信任机构提供访问权限。

Q&A

Q1：Claude Sonnet 5的编程能力提升有多大？

A：根据Anthropic的测试，Claude Sonnet 5在SWE-Bench Pro基准测试上比前代提升了5.1%，在Terminal-Bench 2.1上提升了13.4%。不过，OpenAI的同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上仍领先Sonnet 5约4%。

Q2：Claude Sonnet 5的安全防护机制有哪些改进？

A：Claude Sonnet 5在安全性方面有明显提升，能更有效地拦截恶意请求和提示词注入攻击。模型内置了防护机制，阻止黑客用其发动网络攻击，且由于无法生成可实际运行的漏洞利用代码，其整体网络安全风险被控制在较低水平。

Q3：Claude Sonnet 5的定价是多少？如何获取访问权限？

A：自9月起，Claude Sonnet 5的定价为每百万输入Token 3美元、每百万输出Token 15美元。该模型现已成为Claude免费版和Pro套餐的默认模型，同时也将向Max、Team和企业版套餐开放。开发者可通过Anthropic的API接口调用该模型。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Anthropic发布Claude Sonnet 5大语言模型，编程能力与安全性双升级

来源：SiliconANGLE

2026

07/01

18:07

分享

点赞

Visa、Stripe等140余家机构联合推出Open USD稳定币，剑指Tether

Anthropic发布Claude Sonnet 5大语言模型，编程能力与安全性双升级

Wayve以85亿美元估值启动8500万美元员工股权流动计划

遗留系统与数据缺口制约香港企业财资中心发展

美国要求OpenAI限制其最强大AI模型的访问权限

两党州长达成共识：数据中心建设费用不应转嫁给普通用户

北美电网夏季压力暂缓，但容量危机隐患未除

为270万人守护饮水安全：莫卡辛水电站发电机组更新改造全记录

加州最大光储项目Eland：清洁能源未来的范本

AI音乐视频生成：2026年十款自动化创作工具盘点

欧洲AI安全与网络滥用桌面推演的核心洞察

Rivian R2激光雷达实车曝光，外观设计优于同类车型

Wayve以85亿美元估值启动8500万美元员工股权流动计划

遗留系统与数据缺口制约香港企业财资中心发展

美国要求OpenAI限制其最强大AI模型的访问权限

两党州长达成共识：数据中心建设费用不应转嫁给普通用户

北美电网夏季压力暂缓，但容量危机隐患未除

AI音乐视频生成：2026年十款自动化创作工具盘点

Anthropic推出专为制药研究人员设计的Claude Science

数据中心电力联盟成立，直击AI基础设施最大瓶颈

SpaceX前工程师创办的Mesh光学公司获FTC批准被马斯克收购

AWS推出前沿部署工程团队，加速企业智能体AI落地

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: