Anthropic发布Opus 4.5版本，集成Chrome和Excel新功能

Anthropic周一发布了旗舰模型Opus 4.5，这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色，是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品，分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理，支持付费用户的"无限聊天"功能，并针对智能体应用场景进行了优化，将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。

周一，Anthropic发布了其旗舰模型的最新版本Opus 4.5。这是Anthropic 4.5系列模型中最后发布的一款，此前已于9月推出Sonnet 4.5，10月推出Haiku 4.5。

正如预期，新版Opus在多项基准测试中表现出色，包括编程基准测试（SWE-Bench和Terminal-bench）、工具使用（tau2-bench和MCP Atlas）以及通用问题解决（ARC-AGI 2、GPQA Diamond）。

值得注意的是，Opus 4.5是首个在备受认可的编程基准测试SWE-Bench verified中得分超过80%的模型。

Anthropic还特别强调了Opus的计算机使用和电子表格处理能力，并推出了多款并行产品来展示该模型在这些场景下的表现。与Opus 4.5一同发布的，还有之前处于试点阶段的Claude for Chrome和Claude for Excel产品，现在将更广泛地提供给用户。Chrome扩展将面向所有Max用户开放，而专注于Excel的模型将面向Max、团队版和企业版用户提供。

Opus 4.5还在长上下文操作的记忆改进方面取得了进展，这需要对模型管理内存的方式进行重大调整。

Anthropic研究产品管理负责人Dianne Na Penn告诉TechCrunch："我们在Opus 4.5的训练中对通用长上下文质量进行了改进，但仅仅依靠上下文窗口是不够的。知道要记住哪些正确的细节，这对于补充更长的上下文窗口非常重要。"

这些变化还启用了付费Claude用户长期请求的"无限聊天"功能，当模型达到其上下文窗口时，聊天可以继续进行而不会中断。相反，模型会压缩其上下文内存而不会提醒用户。

许多升级都着眼于智能体使用场景，特别是Opus作为主导智能体指挥一组由Haiku驱动的子智能体的情况。管理这些任务需要强大的工作记忆控制能力，这正是Penn描述的记忆改进真正显示其价值的地方。

Penn说："这就是记忆等基础能力变得非常重要的原因，因为Claude需要能够探索代码库和大型文档，同时知道何时回溯和重新检查某些内容。"

Opus 4.5将面临来自其他最近发布的前沿模型的激烈竞争，最值得注意的是OpenAI的GPT 5.1（11月12日发布）和谷歌的Gemini 3（11月18日发布）。

Q&A

Q1：Opus 4.5相比之前的版本有哪些主要改进？

A：Opus 4.5在多个方面有显著提升：首先在编程基准测试SWE-Bench verified中得分超过80%，成为首个达到这一成绩的模型；其次增强了计算机使用和电子表格处理能力；最后改进了长上下文操作的记忆管理，支持"无限聊天"功能。

Q2：Claude for Chrome和Claude for Excel产品有什么特点？

A：这两款产品之前处于试点阶段，现在随Opus 4.5正式推出。Chrome扩展面向所有Max用户开放，而Excel专版面向Max、团队版和企业版用户提供。它们展示了Opus 4.5在浏览器和电子表格场景下的强大能力。

Q3：Opus 4.5的"无限聊天"功能是如何工作的？

A：当模型达到上下文窗口限制时，传统上聊天会中断。而Opus 4.5的"无限聊天"功能会自动压缩上下文内存，让对话继续进行而不会提醒用户，从而实现无中断的长时间对话体验。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Anthropic发布Opus 4.5版本，集成Chrome和Excel新功能

来源：Techcrunch

2025

11/25

08:39

分享

点赞

零门槛?高产出！联想百应智能体携手通义万相2.6，助力企业AI营销破局增长

OpenAI或从亚马逊获得超100亿美元融资

2026年非结构化数据管理五大预测

Amazon重组AI部门：27年老将统领AGI组织

安全专家给出的8条AI聊天机器人使用安全建议

普渡大学将AI能力列为本科毕业必备要求

浩云长盛的算力工具箱：让兼容与前瞻同行

英特尔酷睿Ultra第三代，如何推动AI PC规模化落地？

Google发布Gemini 3 Flash并将其设为默认模型

思科自研AI模型正式应用于产品，首先赋能身份安全服务

超大规模云厂商在2025年是解决了电力问题还是重新思考了问题？

英伟达成为唯一能免费提供AI模型的厂商

Kneron发布新一代AI芯片，让大语言模型脱离云端运行于本地设备

云端与边缘：AI驱动工程师重新考虑延迟问题

英国政府投资1.3亿美元推动AI芯片产业发展

Wasabi推出Fire高性能存储服务挑战云巨头

Momentic获得1500万美元融资，成为AI时代软件质量"真相之源"

信任、技术、人为因素：网络韧性的基石

人类主导权应引导AI发展而非存在性恐惧

Google在Gemini中推出AI图像检测工具：能识别AI生成内容吗？

Meta申请电力交易许可以加速AI数据中心电力供应

研究员破解AI聊天机器人训练数据来源之谜

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: