Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

Anthropic发布了Claude Haiku 4.5小型AI语言模型，性能接近五个月前的前沿模型Claude Sonnet 4，但成本降低三分之二，速度提升一倍以上。该模型在SWE-bench编程测试中得分73.3%，与Sonnet 4的72.7%相当。API定价为每百万输入令牌1美元，输出令牌5美元，远低于其他大型模型。新模型专为实时低延迟任务设计，可与Sonnet 4.5协同工作处理复杂编程任务。

周三，Anthropic发布了Claude Haiku 4.5，这是一个小型AI语言模型，据报告显示其性能与五个月前的前沿模型Claude Sonnet 4相似，但成本仅为三分之一，速度超过两倍。新模型现已向所有Claude应用程序、网页版和API用户开放。

如果Anthropic报告的Haiku 4.5基准测试结果经得起独立测试验证，那么该公司能够在仅仅五个月内匹配其尖端编程模型的某些能力（以及GPT-5的编程能力），同时提供显著的速度提升和成本削减，这一点值得关注。

回顾一下，Anthropic推出的Claude系列包含三种模型规格：Haiku（小型）、Sonnet（中型）和Opus（大型）。较大的模型基于更大的神经网络，通常包含更深层的上下文知识，但运行速度较慢且成本更高。通过一种称为蒸馏的技术，像Anthropic这样的公司已经能够制造出更小的AI模型，在编程等功能性任务上匹配更大、更老模型的能力，尽管这通常以省略存储知识为代价。

这意味着如果你想与AI模型对话，希望它能对外交政策或世界历史等话题进行更深入、更有意义的分析，你可能更适合使用Sonnet或Opus（需要注意它们也可能出错或编造内容）。但如果你只需要快速的编程辅助，更多关注概念转译而非通用知识，那么Haiku可能因其速度快和成本低而成为更好的选择。

关于成本，Haiku 4.5包含在Claude网页版和应用程序订阅计划中。通过API（面向开发者），小型模型的定价为每百万输入Token 1美元，每百万输出Token 5美元。相比之下，Sonnet 4.5的价格为每百万输入Token 3美元，每百万输出Token 15美元；Opus 4.1的价格为每百万输入Token 15美元，每百万输出Token 75美元。

该模型可作为两个较老模型Haiku 3.5和Sonnet 4的更便宜替代品。Anthropic写道："依赖AI进行实时、低延迟任务的用户，如聊天助手、客户服务智能体或结对编程，将会欣赏Haiku 4.5高智能和卓越速度的结合。"

在SWE-bench Verified测试中，该测试衡量编程任务的性能，Haiku 4.5得分73.3%，而Sonnet 4的类似性能水平为72.7%。根据Anthropic的基准测试，该模型在某些任务（如使用计算机）上据报告也超越了Sonnet 4。9月底发布的Claude Sonnet 4.5仍然是Anthropic的前沿模型，也是该公司称之为"现有最佳编程模型"。

Haiku 4.5在这一特定基准测试集中也令人惊讶地接近OpenAI的GPT-5所能达到的水平（如上图所示），尽管由于结果是自我报告的，可能经过挑选以匹配模型的优势，因此应该持保留态度。

尽管如此，制造一个小型、能力强的编程模型对于像Claude Code这样的智能体编程设置可能具有意想不到的优势。Anthropic设计Haiku 4.5与Sonnet 4.5在多模型工作流程中协同工作。在这种配置下，Anthropic表示，Sonnet 4.5可以将复杂问题分解为多步骤计划，然后协调多个Haiku 4.5实例并行完成子任务，就像派遣工作者更快地完成任务。

关于新模型的更多详细信息，Anthropic发布了系统卡和开发者文档。

Q&A

Q1：Claude Haiku 4.5相比之前的模型有什么优势？

A：Claude Haiku 4.5能够以三分之一的成本和超过两倍的速度，实现与五个月前前沿模型Claude Sonnet 4相似的性能，特别是在编程任务方面表现出色。

Q2：Claude系列的三种模型规格有什么区别？

A：Claude系列包含Haiku（小型）、Sonnet（中型）和Opus（大型）三种规格。大型模型拥有更深层的上下文知识但运行较慢且成本更高，而小型模型速度快成本低但知识存储相对有限。

Q3：Claude Haiku 4.5的定价是多少？

A：通过API使用，Haiku 4.5的价格为每百万输入Token 1美元，每百万输出Token 5美元。对于Claude网页版和应用程序的订阅用户，该模型已包含在订阅计划中。

来源：Arstechnica

0赞

好文章，需要你的鼓励

Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

来源：Arstechnica

2025

10/16

07:55

分享

点赞

亚马逊推出Alexa网页版：生成式AI助手的新选择

Plaud推出可穿戴AI记录设备NotePin S，CES 2026记者新利器

机器人初创公司推出现实版瓦力机器人及其他伴侣产品

VisIC宣布完成2,600万美元B轮融资

CES 2026 | AMD扩张“边缘统治力” “芯片级异构”塑造汽车、工业边缘应用“新法则”

CES 2026 | NVIDIA新风向: Rubin平台面市 ，系统级“AI工厂”成型，物理AI加速落地

英伟达Vera-Rubin平台推出前六月已淘汰现有AI硬件

英特尔推出首批18A工艺制程的Core Ultra处理器

Rokid在CES 2026推出无屏AI智能眼镜

英伟达物理AI模型为新一代机器人铺路

微软发布 GitHub Copilot 的 C++ 代码编辑工具

至顶AI实验室硬核评测：戴尔Precision 5690移动工作站，部署DeepSeek+LobeChat打造个人超级智能体

高性能"孤儿"DAOS与Enakta Labs的复兴之路

思科调研：多数企业不知道如何正确使用AI

Meta与Arm合作推进AI基础设施建设

Nscale与微软签署大规模AI基础设施合作协议

5个强大ChatGPT指令快速减轻工作压力

英伟达DGX Spark：小巧超算处理大模型的新选择

美中AI竞争升级：美国巨额交易对战中国开源策略

微软租用Nscale葡萄牙AI数据中心扩增算力

Oracle推出AI数据库26ai版本和自主AI湖仓平台

沃尔玛与OpenAI合作推出ChatGPT智能购物功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

CES 2026 | NVIDIA新风向: Rubin平台面市，系统级“AI工厂”成型，物理AI加速落地