Anthropic PBC今日发布了Claude Haiku 4.5大语言模型,专门面向成本敏感的应用场景。
该公司对该模型的收费标准为每百万输入Token 1美元,每百万输出Token 5美元。相比之下,Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。
Haiku 4.5是一个混合推理模型,这意味着它可以根据请求调整所使用的计算资源。默认情况下,该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式,让Haiku 4.5产生更复杂的响应,但生成时间会更长。
Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。
据该公司介绍,Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件,如冗长的商业文档。该模型每次响应最多输出64,000个Token。
Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中,该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中,它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。
提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外,该算法的速度是Sonnet 4的两倍多,这使其适用于对延迟敏感的应用,如客户支持聊天机器人。
Haiku 4.5也适合智能体项目。据Anthropic介绍,基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。
新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中,自5月推出以来,该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称,这款编程助手的年度经常性收入正接近10亿美元。
与Anthropic类似,OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限,但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应,通过消除多次从头生成相同输出的需要来降低推理成本。
Q&A
Q1:Claude Haiku 4.5相比其他模型有什么优势?
A:Claude Haiku 4.5主要优势包括成本效率高(收费仅为旗舰模型的三分之一)、处理速度快(比Sonnet 4快两倍多)、安全性强(被称为Anthropic最安全的模型)。它是混合推理模型,可根据需求调整计算资源,支持多模态处理,能处理20万Token的大型文档。
Q2:什么是混合推理模型?它如何工作?
A:混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应,但用户可以启用"扩展思考"模式来获得更复杂的响应,虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。
Q3:Claude Haiku 4.5在智能体应用中有什么作用?
A:Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理,从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务,实现成本优化的同时保持效率。
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
字节跳动发布Seedream 4.0多模态图像生成系统,实现超10倍速度提升,1.4秒可生成2K高清图片。该系统采用创新的扩散变换器架构,统一支持文字生成图像、图像编辑和多图合成功能,在两大国际竞技场排行榜均获第一名,支持4K分辨率输出,已集成至豆包、剪映等平台,为内容创作带来革命性突破。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
红帽公司研究团队提出危险感知系统卡(HASC)框架,为AI系统建立类似"体检报告"的透明度文档,记录安全风险、防护措施和问题修复历史。同时引入ASH识别码系统,为AI安全问题建立统一标识。该框架支持自动生成和持续更新,与ISO/IEC 42001标准兼容,旨在平衡透明度与商业竞争,建立更可信的AI生态系统,推动行业协作和标准化。