Anthropic发布入门级Claude Haiku 4.5混合推理模型

Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型，定价为每百万输入令牌1美元，输出令牌5美元，比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构，可根据需求调整计算资源，支持多模态输入最多20万令牌。在八项基准测试中，性能仅比Sonnet 4.5低不到10%，但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上，适用于客服聊天机器人等低延迟应用场景。

Anthropic PBC今日发布了Claude Haiku 4.5大语言模型，专门面向成本敏感的应用场景。

该公司对该模型的收费标准为每百万输入Token 1美元，每百万输出Token 5美元。相比之下，Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。

Haiku 4.5是一个混合推理模型，这意味着它可以根据请求调整所使用的计算资源。默认情况下，该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式，让Haiku 4.5产生更复杂的响应，但生成时间会更长。

Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。

据该公司介绍，Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件，如冗长的商业文档。该模型每次响应最多输出64,000个Token。

Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中，该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中，它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。

提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外，该算法的速度是Sonnet 4的两倍多，这使其适用于对延迟敏感的应用，如客户支持聊天机器人。

Haiku 4.5也适合智能体项目。据Anthropic介绍，基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。

新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中，自5月推出以来，该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称，这款编程助手的年度经常性收入正接近10亿美元。

与Anthropic类似，OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限，但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应，通过消除多次从头生成相同输出的需要来降低推理成本。

Q&A

Q1：Claude Haiku 4.5相比其他模型有什么优势？

A：Claude Haiku 4.5主要优势包括成本效率高（收费仅为旗舰模型的三分之一）、处理速度快（比Sonnet 4快两倍多）、安全性强（被称为Anthropic最安全的模型）。它是混合推理模型，可根据需求调整计算资源，支持多模态处理，能处理20万Token的大型文档。

Q2：什么是混合推理模型？它如何工作？

A：混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应，但用户可以启用"扩展思考"模式来获得更复杂的响应，虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。

Q3：Claude Haiku 4.5在智能体应用中有什么作用？

A：Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理，从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务，实现成本优化的同时保持效率。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Anthropic发布入门级Claude Haiku 4.5混合推理模型

来源：SiliconANGLE

2025

10/16

11:46

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

谷歌将在印度建造150亿美元AI数据中心枢纽

Eightfold联合创始人获3500万美元融资，打造员工数字孪生AI查询平台

微软英伟达等巨头400亿美元收购数据中心推高AI泡沫

Google Veo 3.1视频生成模型升级，图像转视频能力增强

人工智能商业落地“大考”，研华交出了一份怎样的产业答卷？

Infor深耕亚太市场：云计算与AI驱动制造业数字化转型

Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

高性能"孤儿"DAOS与Enakta Labs的复兴之路

思科调研：多数企业不知道如何正确使用AI

Meta与Arm合作推进AI基础设施建设

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会