Anthropic发布入门级Claude Haiku 4.5混合推理模型

Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。

Anthropic PBC今日发布了Claude Haiku 4.5大语言模型,专门面向成本敏感的应用场景。

该公司对该模型的收费标准为每百万输入Token 1美元,每百万输出Token 5美元。相比之下,Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。

Haiku 4.5是一个混合推理模型,这意味着它可以根据请求调整所使用的计算资源。默认情况下,该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式,让Haiku 4.5产生更复杂的响应,但生成时间会更长。

Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。

据该公司介绍,Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件,如冗长的商业文档。该模型每次响应最多输出64,000个Token。

Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中,该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中,它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。

提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外,该算法的速度是Sonnet 4的两倍多,这使其适用于对延迟敏感的应用,如客户支持聊天机器人。

Haiku 4.5也适合智能体项目。据Anthropic介绍,基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。

新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中,自5月推出以来,该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称,这款编程助手的年度经常性收入正接近10亿美元。

与Anthropic类似,OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限,但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应,通过消除多次从头生成相同输出的需要来降低推理成本。

Q&A

Q1:Claude Haiku 4.5相比其他模型有什么优势?

A:Claude Haiku 4.5主要优势包括成本效率高(收费仅为旗舰模型的三分之一)、处理速度快(比Sonnet 4快两倍多)、安全性强(被称为Anthropic最安全的模型)。它是混合推理模型,可根据需求调整计算资源,支持多模态处理,能处理20万Token的大型文档。

Q2:什么是混合推理模型?它如何工作?

A:混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应,但用户可以启用"扩展思考"模式来获得更复杂的响应,虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。

Q3:Claude Haiku 4.5在智能体应用中有什么作用?

A:Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理,从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务,实现成本优化的同时保持效率。

来源:SiliconANGLE

0赞

好文章,需要你的鼓励

2025

10/16

11:46

分享

点赞

邮件订阅