Anthropic发布入门级Claude Haiku 4.5混合推理模型

Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型，定价为每百万输入令牌1美元，输出令牌5美元，比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构，可根据需求调整计算资源，支持多模态输入最多20万令牌。在八项基准测试中，性能仅比Sonnet 4.5低不到10%，但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上，适用于客服聊天机器人等低延迟应用场景。

Anthropic PBC今日发布了Claude Haiku 4.5大语言模型，专门面向成本敏感的应用场景。

该公司对该模型的收费标准为每百万输入Token 1美元，每百万输出Token 5美元。相比之下，Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。

Haiku 4.5是一个混合推理模型，这意味着它可以根据请求调整所使用的计算资源。默认情况下，该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式，让Haiku 4.5产生更复杂的响应，但生成时间会更长。

Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。

据该公司介绍，Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件，如冗长的商业文档。该模型每次响应最多输出64,000个Token。

Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中，该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中，它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。

提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外，该算法的速度是Sonnet 4的两倍多，这使其适用于对延迟敏感的应用，如客户支持聊天机器人。

Haiku 4.5也适合智能体项目。据Anthropic介绍，基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。

新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中，自5月推出以来，该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称，这款编程助手的年度经常性收入正接近10亿美元。

与Anthropic类似，OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限，但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应，通过消除多次从头生成相同输出的需要来降低推理成本。

Q&A

Q1：Claude Haiku 4.5相比其他模型有什么优势？

A：Claude Haiku 4.5主要优势包括成本效率高（收费仅为旗舰模型的三分之一）、处理速度快（比Sonnet 4快两倍多）、安全性强（被称为Anthropic最安全的模型）。它是混合推理模型，可根据需求调整计算资源，支持多模态处理，能处理20万Token的大型文档。

Q2：什么是混合推理模型？它如何工作？

A：混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应，但用户可以启用"扩展思考"模式来获得更复杂的响应，虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。

Q3：Claude Haiku 4.5在智能体应用中有什么作用？

A：Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理，从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务，实现成本优化的同时保持效率。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Anthropic发布入门级Claude Haiku 4.5混合推理模型

来源：SiliconANGLE

2025

10/16

11:46

分享

点赞

智能体驱动全球创新浪潮，微软携手前沿伙伴迈进消费电子新未来

达索系统在CES 2026上展示AI驱动的医疗创新， 重塑精准、可预测与个性化医疗

Arm 发布 20 项技术预测：洞见 2026 年及未来发

美光推出全球首款面向客户端计算的 PCIe 5.0 QLC SSD

SanDisk重塑经典SSD品牌：WD Black和Blue正式更名为Optimus系列

福特汽车准备在车载系统中引入AI智能助手

ChatGPT推出健康模式：结合医疗数据提供个性化建议

福特推出AI数字助理及新一代BlueCruise自动驾驶技术

联想Legion Pro可卷曲概念机展现移动大屏游戏新体验

印度和新加坡在智能体AI采用方面超越全球同行

华硕CES 2026新品：更小巧的ProArt GoPro笔记本和升级版Zenbook Duo

n8n警告CVSS满分漏洞影响自托管和云版本

谷歌将在印度建造150亿美元AI数据中心枢纽

Eightfold联合创始人获3500万美元融资，打造员工数字孪生AI查询平台

微软英伟达等巨头400亿美元收购数据中心推高AI泡沫

Google Veo 3.1视频生成模型升级，图像转视频能力增强

人工智能商业落地“大考”，研华交出了一份怎样的产业答卷？

Infor深耕亚太市场：云计算与AI驱动制造业数字化转型

Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

高性能"孤儿"DAOS与Enakta Labs的复兴之路

思科调研：多数企业不知道如何正确使用AI

Meta与Arm合作推进AI基础设施建设

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

达索系统在CES 2026上展示AI驱动的医疗创新，重塑精准、可预测与个性化医疗