Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

Anthropic发布了Claude Haiku 4.5小型AI语言模型，性能接近五个月前的前沿模型Claude Sonnet 4，但成本降低三分之二，速度提升一倍以上。该模型在SWE-bench编程测试中得分73.3%，与Sonnet 4的72.7%相当。API定价为每百万输入令牌1美元，输出令牌5美元，远低于其他大型模型。新模型专为实时低延迟任务设计，可与Sonnet 4.5协同工作处理复杂编程任务。

周三，Anthropic发布了Claude Haiku 4.5，这是一个小型AI语言模型，据报告显示其性能与五个月前的前沿模型Claude Sonnet 4相似，但成本仅为三分之一，速度超过两倍。新模型现已向所有Claude应用程序、网页版和API用户开放。

如果Anthropic报告的Haiku 4.5基准测试结果经得起独立测试验证，那么该公司能够在仅仅五个月内匹配其尖端编程模型的某些能力（以及GPT-5的编程能力），同时提供显著的速度提升和成本削减，这一点值得关注。

回顾一下，Anthropic推出的Claude系列包含三种模型规格：Haiku（小型）、Sonnet（中型）和Opus（大型）。较大的模型基于更大的神经网络，通常包含更深层的上下文知识，但运行速度较慢且成本更高。通过一种称为蒸馏的技术，像Anthropic这样的公司已经能够制造出更小的AI模型，在编程等功能性任务上匹配更大、更老模型的能力，尽管这通常以省略存储知识为代价。

这意味着如果你想与AI模型对话，希望它能对外交政策或世界历史等话题进行更深入、更有意义的分析，你可能更适合使用Sonnet或Opus（需要注意它们也可能出错或编造内容）。但如果你只需要快速的编程辅助，更多关注概念转译而非通用知识，那么Haiku可能因其速度快和成本低而成为更好的选择。

关于成本，Haiku 4.5包含在Claude网页版和应用程序订阅计划中。通过API（面向开发者），小型模型的定价为每百万输入Token 1美元，每百万输出Token 5美元。相比之下，Sonnet 4.5的价格为每百万输入Token 3美元，每百万输出Token 15美元；Opus 4.1的价格为每百万输入Token 15美元，每百万输出Token 75美元。

该模型可作为两个较老模型Haiku 3.5和Sonnet 4的更便宜替代品。Anthropic写道："依赖AI进行实时、低延迟任务的用户，如聊天助手、客户服务智能体或结对编程，将会欣赏Haiku 4.5高智能和卓越速度的结合。"

在SWE-bench Verified测试中，该测试衡量编程任务的性能，Haiku 4.5得分73.3%，而Sonnet 4的类似性能水平为72.7%。根据Anthropic的基准测试，该模型在某些任务（如使用计算机）上据报告也超越了Sonnet 4。9月底发布的Claude Sonnet 4.5仍然是Anthropic的前沿模型，也是该公司称之为"现有最佳编程模型"。

Haiku 4.5在这一特定基准测试集中也令人惊讶地接近OpenAI的GPT-5所能达到的水平（如上图所示），尽管由于结果是自我报告的，可能经过挑选以匹配模型的优势，因此应该持保留态度。

尽管如此，制造一个小型、能力强的编程模型对于像Claude Code这样的智能体编程设置可能具有意想不到的优势。Anthropic设计Haiku 4.5与Sonnet 4.5在多模型工作流程中协同工作。在这种配置下，Anthropic表示，Sonnet 4.5可以将复杂问题分解为多步骤计划，然后协调多个Haiku 4.5实例并行完成子任务，就像派遣工作者更快地完成任务。

关于新模型的更多详细信息，Anthropic发布了系统卡和开发者文档。

Q&A

Q1：Claude Haiku 4.5相比之前的模型有什么优势？

A：Claude Haiku 4.5能够以三分之一的成本和超过两倍的速度，实现与五个月前前沿模型Claude Sonnet 4相似的性能，特别是在编程任务方面表现出色。

Q2：Claude系列的三种模型规格有什么区别？

A：Claude系列包含Haiku（小型）、Sonnet（中型）和Opus（大型）三种规格。大型模型拥有更深层的上下文知识但运行较慢且成本更高，而小型模型速度快成本低但知识存储相对有限。

Q3：Claude Haiku 4.5的定价是多少？

A：通过API使用，Haiku 4.5的价格为每百万输入Token 1美元，每百万输出Token 5美元。对于Claude网页版和应用程序的订阅用户，该模型已包含在订阅计划中。

来源：Arstechnica

0赞

好文章，需要你的鼓励

Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

来源：Arstechnica

2025

10/16

07:55

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

高性能"孤儿"DAOS与Enakta Labs的复兴之路

思科调研：多数企业不知道如何正确使用AI

Meta与Arm合作推进AI基础设施建设

Nscale与微软签署大规模AI基础设施合作协议

5个强大ChatGPT指令快速减轻工作压力

英伟达DGX Spark：小巧超算处理大模型的新选择

美中AI竞争升级：美国巨额交易对战中国开源策略

微软租用Nscale葡萄牙AI数据中心扩增算力

Oracle推出AI数据库26ai版本和自主AI湖仓平台

沃尔玛与OpenAI合作推出ChatGPT智能购物功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会