Anthropic今日宣布推出旗下AI模型的最新版本Claude Opus 4.8,此次更新的核心重点在于全面提升智能体相关能力。
Claude Opus 4.8现已正式上线,在多项基准测试中均有所提升,尤其在智能体任务方面表现突出。与此同时,Anthropic还随之推出了多项新功能:
Opus 4.8上线时同步带来了多项全新功能。claude.ai的用户现在可以自主控制Claude处理任务时投入的工作量;Claude Code新增了"动态工作流"功能,使其能够应对超大规模的复杂问题;Opus 4.8的快速模式(运行速度可达标准模式的2.5倍)现在的价格比此前版本降低了三分之二。
与Opus 4.7相比,新版本在智能体编程、计算机操作及逻辑推理等方面均有明显进步。
Anthropic明确表示,Opus 4.8定位为在4.7基础上"小幅但切实的升级",因此定价维持不变,仍为每百万输入Token 5美元、每百万输出Token 25美元。
智能体也是上周谷歌I/O大会的重要议题之一,即将推出的Gemini 3.5 Pro预计将进一步强化这一方面的能力。Anthropic并未将Opus 4.8与Gemini 3.5 Flash进行直接对比,因为两者属于不同类别的模型,但在Anthropic发布的Opus 4.8系统说明文档中有一些相关的横向比较数据。
Q&A
Q1:Claude Opus 4.8的智能体功能有哪些具体提升?
A:Claude Opus 4.8在智能体编程、计算机操作和逻辑推理三个方面相较于Opus 4.7有明显改进。此外还新增了多项功能:用户可自行调节Claude处理任务的投入力度;Claude Code引入"动态工作流"功能,可处理超大规模复杂任务;快速模式运行速度达标准模式的2.5倍,且价格比前代版本降低了三分之二。
Q2:Claude Opus 4.8的价格是多少?
A:Claude Opus 4.8的定价与上一版本Opus 4.7保持一致,每百万输入Token收费5美元,每百万输出Token收费25美元。Anthropic将此次更新定位为"小幅但切实的升级",因此未对价格进行调整。
Q3:Claude Opus 4.8和Gemini 3.5 Flash哪个更强?
A:Anthropic并未将Claude Opus 4.8与Gemini 3.5 Flash进行直接对比,原因是两者属于不同类别的模型,定位和应用场景有所差异。不过在Anthropic发布的Opus 4.8系统说明文档中,有一些与其他模型的横向比较数据可供参考。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
Salesforce正式推出Help Agent,这是基于Agentforce平台的预封装AI客服智能体,可在数分钟内连接企业知识库、操作功能及网页、短信、语音等沟通渠道。该产品同步推出按解决率计费模式,每次成功自主解决客户问题收费2美元,无需按token或操作次数计费。Help Agent支持低代码构建,内置测试功能,并配备全新客户服务门户。该产品预计于2026年7月正式上线。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。