Anthropic今日宣布推出旗下AI模型的最新版本Claude Opus 4.8,此次更新的核心重点在于全面提升智能体相关能力。
Claude Opus 4.8现已正式上线,在多项基准测试中均有所提升,尤其在智能体任务方面表现突出。与此同时,Anthropic还随之推出了多项新功能:
Opus 4.8上线时同步带来了多项全新功能。claude.ai的用户现在可以自主控制Claude处理任务时投入的工作量;Claude Code新增了"动态工作流"功能,使其能够应对超大规模的复杂问题;Opus 4.8的快速模式(运行速度可达标准模式的2.5倍)现在的价格比此前版本降低了三分之二。
与Opus 4.7相比,新版本在智能体编程、计算机操作及逻辑推理等方面均有明显进步。
Anthropic明确表示,Opus 4.8定位为在4.7基础上"小幅但切实的升级",因此定价维持不变,仍为每百万输入Token 5美元、每百万输出Token 25美元。
智能体也是上周谷歌I/O大会的重要议题之一,即将推出的Gemini 3.5 Pro预计将进一步强化这一方面的能力。Anthropic并未将Opus 4.8与Gemini 3.5 Flash进行直接对比,因为两者属于不同类别的模型,但在Anthropic发布的Opus 4.8系统说明文档中有一些相关的横向比较数据。
Q&A
Q1:Claude Opus 4.8的智能体功能有哪些具体提升?
A:Claude Opus 4.8在智能体编程、计算机操作和逻辑推理三个方面相较于Opus 4.7有明显改进。此外还新增了多项功能:用户可自行调节Claude处理任务的投入力度;Claude Code引入"动态工作流"功能,可处理超大规模复杂任务;快速模式运行速度达标准模式的2.5倍,且价格比前代版本降低了三分之二。
Q2:Claude Opus 4.8的价格是多少?
A:Claude Opus 4.8的定价与上一版本Opus 4.7保持一致,每百万输入Token收费5美元,每百万输出Token收费25美元。Anthropic将此次更新定位为"小幅但切实的升级",因此未对价格进行调整。
Q3:Claude Opus 4.8和Gemini 3.5 Flash哪个更强?
A:Anthropic并未将Claude Opus 4.8与Gemini 3.5 Flash进行直接对比,原因是两者属于不同类别的模型,定位和应用场景有所差异。不过在Anthropic发布的Opus 4.8系统说明文档中,有一些与其他模型的横向比较数据可供参考。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。