Anthropic PBC今日发布了Claude Haiku 4.5大语言模型,专门面向成本敏感的应用场景。
该公司对该模型的收费标准为每百万输入Token 1美元,每百万输出Token 5美元。相比之下,Anthropic的旗舰大语言模型Claude Sonnet 4.5的收费是其三倍。
Haiku 4.5是一个混合推理模型,这意味着它可以根据请求调整所使用的计算资源。默认情况下,该算法通过需要有限硬件资源的工作流程生成响应。用户可以启用"扩展思考"模式,让Haiku 4.5产生更复杂的响应,但生成时间会更长。
Anthropic使用公开网页、第三方数据提供商的内容以及内部记录来训练这个大语言模型。后者包括那些授权公司将其数据用于AI训练的Claude客户的信息。Anthropic从数据集中删除了重复条目以提高训练效率。
据该公司介绍,Haiku 4.5可以处理包含多达20万Token信息的多模态提示。这使其能够处理大型文件,如冗长的商业文档。该模型每次响应最多输出64,000个Token。
Anthropic使用八个流行的基准测试来评估Haiku 4.5的能力。在大多数测试中,该大语言模型的表现仅比Anthropic旗舰模型Sonnet 4.5落后不到10%。在包含编程任务和高中数学问题的三个基准测试中,它的表现超过了该公司之前的旗舰大语言模型Sonnet 4。
提高成本效率并非Haiku 4.5的唯一卖点。Anthropic将其描述为该公司工程师迄今为止开发的最安全的大语言模型。此外,该算法的速度是Sonnet 4的两倍多,这使其适用于对延迟敏感的应用,如客户支持聊天机器人。
Haiku 4.5也适合智能体项目。据Anthropic介绍,基于其旗舰Sonnet 4.5模型的智能体可以通过将简单任务委托给Haiku 4.5子智能体来降低推理成本。这样的工作流程可用于自动化多步骤编程和市场研究任务。
新模型通过应用程序编程接口和Anthropic的Claude聊天机器人提供服务。它还包含在Claude Code中,自5月推出以来,该产品已成为公司的主要增长动力。路透社今日援引消息人士的话称,这款编程助手的年度经常性收入正接近10亿美元。
与Anthropic类似,OpenAI也提供其旗舰大语言模型的精简版本。GPT-5 Mini和GPT-5 Nano的推理能力比其同名产品更有限,但成本显著降低。OpenAI和Anthropic都允许开发者缓存频繁出现的提示响应,通过消除多次从头生成相同输出的需要来降低推理成本。
Q&A
Q1:Claude Haiku 4.5相比其他模型有什么优势?
A:Claude Haiku 4.5主要优势包括成本效率高(收费仅为旗舰模型的三分之一)、处理速度快(比Sonnet 4快两倍多)、安全性强(被称为Anthropic最安全的模型)。它是混合推理模型,可根据需求调整计算资源,支持多模态处理,能处理20万Token的大型文档。
Q2:什么是混合推理模型?它如何工作?
A:混合推理模型是指可以根据请求调整计算资源使用量的模型。Claude Haiku 4.5默认通过需要有限硬件资源的工作流程生成响应,但用户可以启用"扩展思考"模式来获得更复杂的响应,虽然生成时间会更长。这种设计让用户可以在成本和性能之间灵活平衡。
Q3:Claude Haiku 4.5在智能体应用中有什么作用?
A:Claude Haiku 4.5非常适合智能体项目应用。基于旗舰Sonnet 4.5模型的智能体可以将简单任务委托给Haiku 4.5子智能体处理,从而降低推理成本。这种工作流程特别适用于自动化多步骤编程和市场研究等复杂任务,实现成本优化的同时保持效率。
好文章,需要你的鼓励
西部数据闪存业务分拆后,SanDisk宣布将停用广受欢迎的WD Black和Blue品牌,推出全新的SanDisk Optimus系列NVMe产品线。WD Blue驱动器将更名为SanDisk Optimus,而高端WD Black驱动器将分别更名为Optimus GX和GX Pro。尽管品牌变更,底层硬件和供应链保持不变。然而受全球内存短缺影响,预计2026年第一季度客户端SSD价格可能上涨超过40%。
上海AI实验室开发RePro训练方法,通过将AI推理过程类比为优化问题,教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性,显著提升了模型在数学、科学和编程任务上的表现,准确率提升5-6个百分点,同时大幅减少无效推理,为高效AI系统发展提供新思路。
福特汽车在2026年消费电子展上宣布将在车辆中引入AI助手技术。该AI助手最初将在福特和林肯智能手机应用中推出,从2027年开始成为新车型的原生功能。福特希望通过AI技术实现车辆个性化体验,提供基于位置、行为和车辆能力的智能服务。同时,福特将采用软件定义车辆架构,推出自研的高性能计算中心,提升信息娱乐、驾驶辅助等功能。
MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考,实现了最高2.03倍的速度提升和17.4倍的反应延迟改善,成功展示了机器人打乒乓球等高难度任务,为机器人在动态环境中的应用开辟了新可能性。