Anthropic PBC今日发布了Claude Haiku 4.5大语言模型,专门面向成本敏感的应用场景。
该公司对该模型的收费标准为每百万输入Token 1美元,每百万输出Token 5美元。相比之下,Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。
Haiku 4.5是一个混合推理模型,这意味着它可以根据请求调整所使用的计算资源。默认情况下,该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式,让Haiku 4.5产生更复杂的响应,但生成时间会更长。
Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。
据该公司介绍,Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件,如冗长的商业文档。该模型每次响应最多输出64,000个Token。
Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中,该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中,它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。
提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外,该算法的速度是Sonnet 4的两倍多,这使其适用于对延迟敏感的应用,如客户支持聊天机器人。
Haiku 4.5也适合智能体项目。据Anthropic介绍,基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。
新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中,自5月推出以来,该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称,这款编程助手的年度经常性收入正接近10亿美元。
与Anthropic类似,OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限,但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应,通过消除多次从头生成相同输出的需要来降低推理成本。
Q&A
Q1:Claude Haiku 4.5相比其他模型有什么优势?
A:Claude Haiku 4.5主要优势包括成本效率高(收费仅为旗舰模型的三分之一)、处理速度快(比Sonnet 4快两倍多)、安全性强(被称为Anthropic最安全的模型)。它是混合推理模型,可根据需求调整计算资源,支持多模态处理,能处理20万Token的大型文档。
Q2:什么是混合推理模型?它如何工作?
A:混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应,但用户可以启用"扩展思考"模式来获得更复杂的响应,虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。
Q3:Claude Haiku 4.5在智能体应用中有什么作用?
A:Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理,从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务,实现成本优化的同时保持效率。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。