Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

Anthropic 发布全新前沿 AI 模型 Claude 3.7 Sonnet，这是首个混合推理模型，能够实时回答问题，也可根据用户需求延长思考时间以提供更深入的答案。该模型在多项基准测试中表现优异，并推出了专注于代码开发的 Claude Code 版本。

人工智能模型开发公司 Anthropic PBC 推出了一款名为 Claude 3.7 Sonnet 的前沿模型，向 OpenAI、DeepSeek Ltd. 等业内公司发起了挑战。

与之前的模型不同，Claude 3.7 Sonnet 能够根据用户的要求，对问题进行任意时长的"思考"。根据其思考时间的长短，其回答可能会有很大的差异。

该公司表示，Claude 3.7 Sonnet 是首个"混合 AI 推理模型"，因为它既可以实时回答，也可以根据需要生成经过深思熟虑的回答。用户可以选择何时激活其推理能力，并指定希望它思考问题的时长。

Claude 3.7 Sonnet 现已向所有用户开放，包括免费用户，但只有付费订阅用户才能使用其高级推理功能。免费用户只能使用实时版本，不过该公司表示这相比其前身 Claude 3.5 Sonnet 仍有所改进。

该公司表示，Claude 3.7 Sonnet 的收费标准为每百万输入 token 3 美元，这意味着你可以输入约 75 万字 (超过《指环王》三部曲的总字数) 只需 3 美元。输出则收取每百万 token 15 美元。

因此，Claude 3.7 Sonnet 的价格比 OpenAI 的 o3-mini 推理模型和 DeepSeek 的 R1 要贵，后两者的价格分别便宜约三倍和六倍。不过，Anthropic 的模型一直较为昂贵，用户使用 Claude 3.5 Sonnet 时支付的费率完全相同。所以他们无需额外付费就能获得新的推理功能。

Claude 3.7 Sonnet 是该公司首次尝试开发推理模型。与传统模型相比，推理模型需要更多的计算能力和更长的响应时间。它们的工作原理是将用户的问题或难题分解成一系列小步骤，分别考虑每个步骤后再整合回答，这种技术通常能产生更好的答案。

目前，用户需要自行选择 Claude 3.7 Sonnet 思考问题的时长。但在即将发布的更新中，该公司表示模型将能够自行确定最合适的思考时间，在成本和答案质量之间取得最佳平衡。

Anthropic 的产品和研究主管 Dianne Penn 在接受 VentureBeat 采访时表示，目标是让模型能够判断何时需要即时回答，何时需要更深入的思考。

"模型本身应该能识别何时需要更深入的思考并作出调整，而不是要求用户明确选择不同的推理模式，"她说。

Claude 3.7 Sonnet 的另一个亮点是它会通过"可视化草稿本"展示其内部思考过程。Penn 表示，用户可以看到大多数提示的完整思维链，但在某些情况下，出于信任和安全考虑，可能会隐藏某些元素。

在性能方面，Claude 3.7 Sonnet 与竞争对手相比表现出色，在真实世界编程基准测试 SWE-Bench 上得分为 62.3%，而 OpenAI 的 o3-mini 为 49.3%，DeepSeek R1 为 49.2%。

在另一项用于衡量其与模拟用户和外部应用程序接口交互能力的测试 TAU-Bench 中，Claude 3.7 Sonnet 得分为 81.2%，超过了 OpenAI o1 模型的 73.5%。

该公司补充说，Claude 3.7 Sonnet 还将回答更多问题，减少拒绝回应的情况。这是因为它能够更好地区分良性和有害的提示。

编程模型和更多资金即将到来

除了推理模型外，Anthropic 还推出了一个名为 Claude Code 的新模型，目前作为研究预览版提供，更专注于编程任务。

在演示中，该公司展示了 Claude Code 如何通过单个提示（如"解释这个项目结构"）分析开发项目。它还使开发者能够通过输入描述如何修改代码的普通英语提示来修改代码库。完成更改后，它会描述所做的编辑，然后测试错误或将更新推送到 GitHub 仓库。

该公司表示，Claude Code 目前向有限数量的用户开放测试，采用先到先得的原则提供访问权限，因此想要尝试的开发者不应该延迟。

今天宣布的新模型代表着 Anthropic 的一个重要突破，而且可能很快会有更多进展。据《华尔街日报》今天的另一份报道称，该公司正在就 35 亿美元的融资轮进行深入谈判。

这个金额显著高于最初计划募集的 20 亿美元，据《华尔街日报》援引两位知情匿名消息源称，这将使该创业公司的估值达到约 615 亿美元。据称 Lightspeed Venture Partners 将领投此轮融资，General Catalyst 和其他多家机构也将参与。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

来源：SiliconANGLE

2025

02/25

17:01

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: