Anthropic 的 Claude 3.7 Sonnet 瞄准 OpenAI 和 DeepSeek，开启 AI 新一轮较量

Anthropic 推出 Claude 3.7 Sonnet 模型，为用户提供前所未有的 AI 思考时间控制能力，并发布 Claude Code 命令行编码助手。这标志着 Anthropic 积极进军企业 AI 市场，可能重塑企业软件开发和工作自动化方式。新模型在延长思考模式下在研究生级推理任务上达到 78.2% 的准确率，挑战 OpenAI 最新模型并超越 DeepSeek-R1，展现出强大的竞争力。

Anthropic 发布 Claude 3.7 Sonnet 模型，向 OpenAI、DeepSeek 及整个 AI 行业发出警示。这个新模型让用户能够前所未有地控制 AI 在生成响应前的"思考"时间。此次发布同时伴随着命令行 AI 编程助手 Claude Code 的推出，标志着 Anthropic 正积极进军企业级 AI 市场，这可能会重塑企业软件开发和工作自动化的方式。

当前形势紧迫。上个月，DeepSeek 推出的 AI 模型以远低于美国系统的成本实现了相当的性能，这一消息震惊科技界，导致英伟达股价下跌 17%，引发了对美国 AI 领导地位的担忧。如今，Anthropic 押注于对 AI 推理的精确控制，而不仅仅是原始速度或成本节约，以此获得竞争优势。

Anthropic 的研究产品管理负责人 Dianne Penn 在接受 VentureBeat 采访时表示："我们认为推理是 AI 的核心组成部分，而不是需要额外付费才能使用的独立功能。就像人类一样，AI 应该能够同时处理快速响应和复杂思考。对于'现在几点了？'这样的简单问题，它应该立即回答。但对于复杂任务，比如规划一个为期两周的意大利旅行并考虑无麸质饮食需求，它需要更多的处理时间。"

基准测试数据支持 Anthropic 的雄心愿景。在扩展思考模式下，Claude 3.7 Sonnet 在研究生级别推理任务中达到 78.2% 的准确率，挑战 OpenAI 的最新模型并超越 DeepSeek-R1。

在实际应用中的指标更具说服力。该模型在零售导向的工具使用方面得分为 81.2%，在指令遵循方面显著提升 (93.2%) —— 这些都是竞争对手要么表现不佳，要么尚未公布结果的领域。

虽然 DeepSeek 和 OpenAI 在传统数学基准测试中领先，但 Claude 3.7 的统一方法证明，单一模型可以有效地在快速响应和深度分析之间切换，这可能让企业不再需要为不同类型的任务维护多个 AI 系统。

Anthropic 同时推出了 Claude Code，这是一个命令行工具，允许开发者将复杂的工程任务直接委托给 AI。该系统在提交代码更改前需要人工批准，体现了业界对负责任 AI 开发的日益关注。

Penn 还用一个意想不到的例子说明了 AI 能力的巨大进步："我们一直让不同版本的 Claude 玩宝可梦...这个版本已经到达了枯叶市，抓到了多只宝可梦，甚至会刷级升级。它能针对对手选择合适的宝可梦对战。"

对企业客户来说，这可能意味着不必再维护多个用于不同任务的 AI 系统，而是部署一个更强大的统一解决方案。接下来的几个月将揭示 Anthropic 在统一 AI 推理上的押注是否会重塑企业市场，或仅仅成为行业快速发展中的又一次尝试。

来源：VentureBeat

0赞

好文章，需要你的鼓励

Anthropic 的 Claude 3.7 Sonnet 瞄准 OpenAI 和 DeepSeek，开启 AI 新一轮较量

来源：VentureBeat

2025

02/25

16:56

分享

点赞

西子洁能加快美国燃机余热锅炉订单，24年NE技术合作接住数据中心供电需求

印度罚款惠普14亿卢比：墨盒、碳粉与PC"串谋"价格操纵

可口可乐旗下Fairlife乳品公司遭勒索软件攻击，被迫停产

从上海到世界：WAICA正以“AI原生”范式重写顶会规则

从主机节点到异构机架：重新思考AI CPU

苹果在印度恢复银行卡支付功能，距暂停已逾四年

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: