Claude自述：我的质量正在下滑

Anthropic旗下AI助手Claude近期遭遇多重困境：本周一出现重大服务中断，错误率升高影响Claude.ai及Claude Code约50分钟。与此同时，社交媒体和GitHub上关于Claude回答质量下降的投诉持续增加。有趣的是，当被要求分析自身GitHub问题库时，Claude得出结论称"质量投诉急剧上升"，4月份质量问题已超20条，是1至2月基准的3.5倍。不过，Anthropic尚未对此作出回应。

曾经是众多程序员心目中AI首选的Anthropic旗下Claude，近期在服务成本与用户感知质量两方面均出现明显下滑，就连该模型自己也对此有所察觉。

本周一，Claude发生短暂宕机，官方将其定性为"重大故障"。此次服务中断进一步加剧了用户的不满情绪，而这些不满，连AI自身都能感知到。

本次宕机表现为错误率异常升高，影响范围涵盖Claude.ai与Claude Code，故障时间为UTC时间15:31至16:19。

这还不是全部。过去数月间，根据社交媒体上的用户反馈以及GitHub上提交的问题报告，Claude的回答质量正在持续下降。与此同时，Anthropic为平衡容量与需求，已采取措施限制用户在高峰时段的使用量。

为获得更客观的评估数据，我们将Claude Code的GitHub代码仓库指向Claude本身，筛选出2026年1月以来涉及质量问题的公开issue，并输入以下提示词："分析并绘制该代码仓库中自2026年1月以来关于Claude Code质量的投诉情况，使用提及质量问题的公开issue，并判断这些问题近期是否有所增加。"

Anthropic的AI模型得出结论："是的，质量方面的投诉已急剧增加——数据呈现出一个相当清晰的趋势。"

本周一我们要求Claude重新进行自我分析，结果与此前相近。模型输出的内容显示："增长速度相当显著：4月份在短短13天内已出现20余个质量问题，照此速度，有望超过3月份的18个——而3月份本身已是1月至2月基线水平的3.5倍。"

当然，Claude本身并非可靠的叙述者，某人（或某个机器人）向Claude Code代码仓库提交的报告，并不代表该报告内容准确或有效。目前有迹象表明，大量issue本身就是由AI生成的——这是开源开发者社区中被广泛关注的问题，可能在一定程度上推高了报告数量。

此外，Anthropic的GitHub Actions脚本似乎会在一段时间不活跃后自动关闭issue，这或许会掩盖部分尚未解决的问题。

《The Register》此前曾报道过Claude在自我分析中标记的部分问题，例如缓存异常，以及AMD AI总监Stella Laurenzo关于Claude回答质量下滑的说法。另一些问题尚未得到证实，例如有报告称"Claude自主删除了属于某真实付费客户（JIXEN）的35,254条生产环境客户消息记录以及35,874条账单交易记录"。

发布这一帖子的个人或机器人账号此前没有任何其他发帖记录。《The Register》已尝试联系疑似在印度注册的私人企业Jixen Enterprises Private Limited以核实该说法，但截至发稿尚未收到回复。有开发者反映曾在使用Claude Code及其他模型时遭遇数据丢失，但即便属实，也不排除用户操作失误的可能性。

无论如何，Claude确实能够援引GitHub上真实的issue来支撑其"推理"，因此质量投诉报告数量持续增多这一整体趋势是客观存在的。

该模型援引了多个issue来支持其结论，包括"Claude Code的预测优先行为在涉及资本风险的项目中存在危险"（#46212）、"经过2月份更新后，Claude Code已无法胜任复杂工程任务"（#42796，已由Claude Code负责人Boris Cherny回应）、"针对付费用户的人为降级、获取偏差与不可接受的算力限速"（#46949），以及"Opus 4.6：迭代编码任务中出现严重质量退化"（#46099）。

然而，来自Margin Lab的数据显示，Claude Opus 4.6在SWE-Bench-Pro测试中至少维持了原有得分。自2月份以来的多次评估结果存在一定波动，但并无实质性变化。

截至发稿，Anthropic尚未就Claude质量问题作出回应。

Q&A

Q1：Claude最近出现了哪些服务质量问题？

A：近几个月来，根据社交媒体反馈和GitHub上的issue报告，Claude的回答质量持续下滑。Anthropic为平衡容量与需求，已限制高峰时段的用户使用量。2026年4月，仅13天内就已出现20余个质量相关issue，预计将超过3月份的18个，而3月份本身已是1月至2月基线的3.5倍。

Q2：Claude自我评估质量下滑的结论可信吗？

A：Claude并非可靠的叙述者，其援引的GitHub issue未必全部准确或有效。部分issue可能由AI自动生成，Anthropic的脚本还会自动关闭长期不活跃的issue，可能掩盖真实问题。不过，整体趋势——质量投诉报告数量持续增多——是客观可见的。

Q3：Claude Opus 4.6在专业测试中表现如何？

A：根据Margin Lab的数据，Claude Opus 4.6在SWE-Bench-Pro测试中的得分基本保持稳定，自2月份以来的多次评估虽存在一定波动，但无实质性变化，与用户在实际使用中的主观感受存在一定落差。

来源：The Register

0赞

好文章，需要你的鼓励

Claude自述：我的质量正在下滑

来源：The Register

2026

04/14

13:36

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Cloudflare重构命令行工具，智能体成为API主要用户

超大规模数据中心向内陆迁移，AI驱动电力需求重塑选址格局

Anthropic的AI助手Claude现已登陆Microsoft Word

苹果多款Mac产品缺货，全球内存供应危机波及苹果

斯坦福2026年AI指数报告：中美AI差距已消弭

调查显示：AI将对选举和人际关系产生负面影响

微软计划将Copilot升级为智能体AI助手

OpenAI收购AI个人理财初创公司Hiro

Linux内核AI辅助代码新规发布，开发者必读

斯坦福报告：AI专家与普通公众之间的认知鸿沟正在加深

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会