Anthropic近日发布了最新的AI模型Claude Opus 4.8。此次更新距上一版本发布不足两个月,体现出Anthropic正在加快产品迭代节奏。
Anthropic将Claude Opus 4.8描述为"判断力更敏锐、对自身进展的反馈更加诚实,并且能够比前代模型更长时间地独立工作"。
据Anthropic介绍,"早期测试用户反映,Opus 4.8更倾向于主动标注工作中的不确定之处,并减少了无依据的断言性表述。"
在定价方面,Claude Opus 4.7与Opus 4.8保持一致,不作调整。
从Anthropic公布的两款模型基准测试对比来看,Opus 4.8的快速模式速度大约提升了2.5倍,同时成本降低至原来的三分之一。
Opus 4.8默认采用高强度运算模式。Anthropic表示,在编程任务上,该模式与Opus 4.7消耗的Token数量相近,但性能表现更优。此外,公司也针对"额外"和"最高"性能设置提升了Claude Code的调用频率上限。
用户可以选择"额外"(在Claude Code中对应"xhigh")或"最高"两种模式,模型将消耗更多Token以获得更好的结果。官方建议在处理高难度任务或长周期异步工作流时选用"额外"模式。为适配更高Token消耗量,Anthropic已相应提升了Claude Code的调用频率限制,用户可根据具体项目需求灵活选择。
除Opus 4.8正式上线外,Anthropic今日还同步推出了另外三项更新。
此外,Anthropic承诺将在"未来数周内"向所有用户开放Mythos级模型。该网络安全模型于今年四月初首次亮相,但目前访问权限仍仅限于部分关键软件平台的指定合作方。
关于上述新功能及Claude Opus 4.8的详细信息,可参阅Anthropic的官方公告。
上一版本Claude Opus 4.7于4月16日正式发布,而此次Opus 4.8的推出距离上次仅相隔六周。新模型目前已在全球范围内正式上线。
Q&A
Q1:Claude Opus 4.8相比4.7版本有哪些提升?
A:Claude Opus 4.8在多个方面进行了优化:判断力更强,能主动标注工作中的不确定之处,减少无依据断言;快速模式速度提升约2.5倍,成本降低至原来的三分之一;默认采用高强度运算模式,在编程任务上性能更优但Token消耗量与4.7相近。此外,调用频率上限也有所提升,用户可根据需求选择不同性能档位。
Q2:Claude Opus 4.8的价格有没有变化?
A:没有变化。Anthropic明确表示,Claude Opus 4.8与上一版本Opus 4.7的定价保持一致,用户无需承担额外费用即可使用新版本的功能升级。
Q3:Anthropic的Mythos网络安全模型什么时候开放?
A:Mythos网络安全模型于2025年4月初首次发布,但目前仅向部分关键软件平台的特定合作方开放。Anthropic已承诺将在未来数周内向所有用户开放该模型的访问权限,具体上线时间请关注官方公告。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。