Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

Anthropic 发布全新前沿 AI 模型 Claude 3.7 Sonnet，这是首个混合推理模型，能够实时回答问题，也可根据用户需求延长思考时间以提供更深入的答案。该模型在多项基准测试中表现优异，并推出了专注于代码开发的 Claude Code 版本。

人工智能模型开发公司 Anthropic PBC 推出了一款名为 Claude 3.7 Sonnet 的前沿模型，向 OpenAI、DeepSeek Ltd. 等业内公司发起了挑战。

与之前的模型不同，Claude 3.7 Sonnet 能够根据用户的要求，对问题进行任意时长的"思考"。根据其思考时间的长短，其回答可能会有很大的差异。

该公司表示，Claude 3.7 Sonnet 是首个"混合 AI 推理模型"，因为它既可以实时回答，也可以根据需要生成经过深思熟虑的回答。用户可以选择何时激活其推理能力，并指定希望它思考问题的时长。

Claude 3.7 Sonnet 现已向所有用户开放，包括免费用户，但只有付费订阅用户才能使用其高级推理功能。免费用户只能使用实时版本，不过该公司表示这相比其前身 Claude 3.5 Sonnet 仍有所改进。

该公司表示，Claude 3.7 Sonnet 的收费标准为每百万输入 token 3 美元，这意味着你可以输入约 75 万字 (超过《指环王》三部曲的总字数) 只需 3 美元。输出则收取每百万 token 15 美元。

因此，Claude 3.7 Sonnet 的价格比 OpenAI 的 o3-mini 推理模型和 DeepSeek 的 R1 要贵，后两者的价格分别便宜约三倍和六倍。不过，Anthropic 的模型一直较为昂贵，用户使用 Claude 3.5 Sonnet 时支付的费率完全相同。所以他们无需额外付费就能获得新的推理功能。

Claude 3.7 Sonnet 是该公司首次尝试开发推理模型。与传统模型相比，推理模型需要更多的计算能力和更长的响应时间。它们的工作原理是将用户的问题或难题分解成一系列小步骤，分别考虑每个步骤后再整合回答，这种技术通常能产生更好的答案。

目前，用户需要自行选择 Claude 3.7 Sonnet 思考问题的时长。但在即将发布的更新中，该公司表示模型将能够自行确定最合适的思考时间，在成本和答案质量之间取得最佳平衡。

Anthropic 的产品和研究主管 Dianne Penn 在接受 VentureBeat 采访时表示，目标是让模型能够判断何时需要即时回答，何时需要更深入的思考。

"模型本身应该能识别何时需要更深入的思考并作出调整，而不是要求用户明确选择不同的推理模式，"她说。

Claude 3.7 Sonnet 的另一个亮点是它会通过"可视化草稿本"展示其内部思考过程。Penn 表示，用户可以看到大多数提示的完整思维链，但在某些情况下，出于信任和安全考虑，可能会隐藏某些元素。

在性能方面，Claude 3.7 Sonnet 与竞争对手相比表现出色，在真实世界编程基准测试 SWE-Bench 上得分为 62.3%，而 OpenAI 的 o3-mini 为 49.3%，DeepSeek R1 为 49.2%。

在另一项用于衡量其与模拟用户和外部应用程序接口交互能力的测试 TAU-Bench 中，Claude 3.7 Sonnet 得分为 81.2%，超过了 OpenAI o1 模型的 73.5%。

该公司补充说，Claude 3.7 Sonnet 还将回答更多问题，减少拒绝回应的情况。这是因为它能够更好地区分良性和有害的提示。

编程模型和更多资金即将到来

除了推理模型外，Anthropic 还推出了一个名为 Claude Code 的新模型，目前作为研究预览版提供，更专注于编程任务。

在演示中，该公司展示了 Claude Code 如何通过单个提示（如"解释这个项目结构"）分析开发项目。它还使开发者能够通过输入描述如何修改代码的普通英语提示来修改代码库。完成更改后，它会描述所做的编辑，然后测试错误或将更新推送到 GitHub 仓库。

该公司表示，Claude Code 目前向有限数量的用户开放测试，采用先到先得的原则提供访问权限，因此想要尝试的开发者不应该延迟。

今天宣布的新模型代表着 Anthropic 的一个重要突破，而且可能很快会有更多进展。据《华尔街日报》今天的另一份报道称，该公司正在就 35 亿美元的融资轮进行深入谈判。

这个金额显著高于最初计划募集的 20 亿美元，据《华尔街日报》援引两位知情匿名消息源称，这将使该创业公司的估值达到约 615 亿美元。据称 Lightspeed Venture Partners 将领投此轮融资，General Catalyst 和其他多家机构也将参与。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

来源：SiliconANGLE

2025

02/25

17:01

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会