Anthropic PBC今日发布了Claude Haiku 4.5大语言模型,专门面向成本敏感的应用场景。
该公司对该模型的收费标准为每百万输入Token 1美元,每百万输出Token 5美元。相比之下,Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。
Haiku 4.5是一个混合推理模型,这意味着它可以根据请求调整所使用的计算资源。默认情况下,该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式,让Haiku 4.5产生更复杂的响应,但生成时间会更长。
Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。
据该公司介绍,Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件,如冗长的商业文档。该模型每次响应最多输出64,000个Token。
Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中,该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中,它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。
提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外,该算法的速度是Sonnet 4的两倍多,这使其适用于对延迟敏感的应用,如客户支持聊天机器人。
Haiku 4.5也适合智能体项目。据Anthropic介绍,基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。
新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中,自5月推出以来,该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称,这款编程助手的年度经常性收入正接近10亿美元。
与Anthropic类似,OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限,但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应,通过消除多次从头生成相同输出的需要来降低推理成本。
Q&A
Q1:Claude Haiku 4.5相比其他模型有什么优势?
A:Claude Haiku 4.5主要优势包括成本效率高(收费仅为旗舰模型的三分之一)、处理速度快(比Sonnet 4快两倍多)、安全性强(被称为Anthropic最安全的模型)。它是混合推理模型,可根据需求调整计算资源,支持多模态处理,能处理20万Token的大型文档。
Q2:什么是混合推理模型?它如何工作?
A:混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应,但用户可以启用"扩展思考"模式来获得更复杂的响应,虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。
Q3:Claude Haiku 4.5在智能体应用中有什么作用?
A:Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理,从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务,实现成本优化的同时保持效率。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。