Anthropic已开始限制其Claude订阅服务的使用量,以应对不断增长的需求对其计算容量造成的压力。
Anthropic技术团队成员Thariq Shihipar在X平台发文表示:"为了管理Claude日益增长的需求,我们正在调整免费/专业/最高级订阅用户在高峰时段的5小时会话限制。您的每周限制保持不变。"
Shihipar补充道:"在工作日太平洋时间上午5点到11点/格林威治时间下午1点到7点期间,您的5小时会话限制将比以前更快地被用完。"
实际上,这一变化在全球工作高峰时段集中实施了更严格的使用控制,此时企业和个人用户的需求都处于最高水平。这里的逻辑是,通过加快用户在这些时间窗口内达到会话限制的速度,Anthropic实际上在重新分配访问权限以防止系统过载,同时仍保持整体的每周使用配额。
Shihipar在帖子中提到的是Claude的订阅计划,这些计划包含使用限制,而Claude的API计划不受此变化影响。
根据模型提供商的说法,订阅计划的使用限制被定义为控制用户在特定时间段内与Claude交互程度的机制。文档中写道:"将此视为您的'对话预算',它决定了您可以向Claude发送多少条消息,或者在需要等待限制重置之前可以与Claude Code工作多长时间。"
值得注意的是,Anthropic对其订阅计划的定价并不像其基于API的计划那样明确,后者取决于多个因素,包括基础输入Token、缓存写入和输出Token。
Shihipar后来写道,使用限制的变化将影响大约"7%的用户",特别是专业版用户。作为解决方案,这位高级技术人员建议在"非高峰时段"运行"Token密集型后台作业"以延长会话限制。
分析师表示,此举将为用户带来问题。
Pareekh Consulting首席分析师Pareekh Jain说:"影响主要限于通过订阅计划使用Claude的个人用户、专业消费者和小团队,在这种情况下,使用上限和限流是管理共享计算和成本的预期措施。"
Jain补充说,企业通常不受影响,因为它们通常依赖基于API的消费或专门合同。
不过,Jain说企业中的重度用户也会受到影响,导致实验速度变慢或试点进展缓慢,他认为这可能是Anthropic推动团队采用API的策略。
根据Forrester副总裁兼首席分析师Charlie Dai的说法,这种推动可能意味着模型提供商获得更有保障的收入。
Greyhound Research首席分析师Sanchit Vir Gogia对变化如何影响大型企业提出了不同观点,他指出大多数企业并非在纯粹的API模式下运营,实际上使用情况分散在订阅层级、团队环境、开发工具和API集成中。
Gogia说:"正是在这种混合环境中,影响开始显现。订阅层不再是边缘的。它们为实际工作流程提供动力,特别是在开发、分析和快速执行场景中。当这些层在高峰需求期间变得不一致时,企业生产力会受到间接但有意义的影响。"
事实上,Gogia也认为这一变化迫使企业选择基于API的计划以确保生产力:"企业正在进入一个不再假定性能一致性的阶段。必须进行架构设计、谈判和付费。如果需求继续超过基础设施容量,这种细分将变得更加明确。"
更重要的是,分析师认为Anthropic的竞争对手和其他供应商在平衡使用量与容量方面正在采取类似路线。
Jain说:"由于所有主要供应商都正在引入或将引入类似约束,受影响的用户可能无法通过转向其他供应商平台获得缓解。他们实际上是在不同形式的限制之间移动,而不是完全摆脱它们。"
同样的逻辑也是为什么Jain认为用户的反弹有限,特别是在转换供应商作为对Anthropic政策变化回应方面。
与Jain观点一致,Avasant研究总监Chandrika Dutt指出,模型提供商实施的容量限流措施与云计算早期超大规模云服务商采用的策略非常相似。
Dutt说,亚马逊云服务、微软Azure和谷歌云等云提供商面临类似的容量约束,它们没有立即扩展规模,而是引入了塑造需求和平滑消费模式的机制,如预留容量模型和定价激励措施,将使用量转移到非高峰时段。
Q&A
Q1:Anthropic为什么要限制Claude的使用量?
A:Anthropic限制Claude使用量是为了应对不断增长的用户需求对其计算容量造成的压力。通过在工作日高峰时段加快用户达到5小时会话限制的速度,重新分配访问权限以防止系统过载,同时保持每周总使用配额不变。
Q2:这次限制会影响哪些用户?
A:主要影响通过订阅计划使用Claude的个人用户、专业消费者和小团队,大约占总用户的7%,特别是专业版用户。企业用户通常不受影响,因为他们主要使用API计划或专门合同,但企业中的重度用户可能会感受到实验和试点速度变慢的影响。
Q3:用户可以如何应对这种使用限制?
A:Anthropic技术人员建议在非高峰时段运行Token密集型后台作业来延长会话限制。不过分析师指出,由于主要供应商都在引入类似约束,用户转换平台可能无法获得真正缓解,只是在不同形式的限制间移动。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。