微软旗下GitHub上周向Copilot用户发出通知,要求用户降低对该AI服务的使用频率,以减轻公司服务器的压力。此前,GitHub于上月发现了一个Token计数漏洞,该漏洞似乎已导致公司的定价模型出现严重问题。
GitHub在声明中表示:"随着GitHub Copilot的持续快速增长,我们持续观察到高并发和高强度使用模式的增加。尽管我们理解这可能源于合理的工作流程,但此类使用方式对我们的共享基础设施和运营资源造成了巨大压力。"
为改善Copilot的使用体验,GitHub表示将在未来几周内实施使用限制,以"更好地平衡容量"并提升"整体服务稳定性"。
GitHub同时宣布,将对Copilot Pro+用户停止提供Anthropic的Opus 4.6 Fast模型。
Anthropic同样遭遇了类似的容量问题,并已采取措施引导用户改变使用习惯,在高峰需求期间劝阻用户过度使用,此举引发了开发者的广泛不满。使用OpenAI Codex的开发者也对限速措施表示强烈抗议。由风险投资支撑的"Token随意畅用"模式,如今终于到了结账的时刻。
在进一步削减成本的举措中,GitHub还以滥用为由,暂停了所有GitHub Copilot Pro的免费试用资格。
遭遇意外限速的GitHub Copilot用户对此强烈不满。
用户John Clary通过电子邮件向《The Register》表示:"我是一名业余爱好者,使用GitHub Copilot Pro Plus,每月经常额外花费数百英镑购买点数。我频繁遭遇短暂限速,请求被中断,且没有倒计时提示,只显示几秒后重试,通常不超过30秒。不过我一般会等大约15分钟再继续,因为如果不等够时间,往往会在AI处理重要任务时再次触发限速。"
Clary表示,这种情况他尚能应对,但在本周一晚间,他遭遇了长达44小时的"每周使用限额",他认为这与GitHub上周的公告直接相关。
起初他以为是系统故障,等待了一段时间,但一小时后意识到限速限制不会解除。于是他提交了一张支持工单,并无奈切换至Auto模式,在该模式下Copilot会代替用户自动选择模型。
Auto模式似乎倾向于选择推理成本更低的模型,因为Clary表示其性能明显更差。
"从那以后,我的项目几乎没有取得什么进展。Auto模式选出的模型质量很差,经常在不告知我的情况下走捷径,我还需要花费大量时间让它重新纠正。"他说道。
类似的不满情绪也出现在GitHub Copilot社区的讨论中。关于限速问题的长期讨论帖近期迎来了投诉潮——仅过去两天,某一讨论帖中就新增了约三十多条相关评论。
用户纷纷对"离谱的漫长限速时间"表示警惕,有人反映被告知需要等待数天才能恢复使用。
GitHub将此次事件定性为服务器容量问题,但外界普遍认为这也是一次控制成本的举措。
研究咨询公司StratoAtlas的创始人Roman Kir在一篇网络帖子中指出,GitHub之所以被迫实施限制,根本原因在于其定价模型已经崩溃。
"2026年3月,GitHub发现了一个漏洞:其限速系统对Claude Opus 4.6和GPT-5.4等新型模型的Token统计存在严重低估。"他写道,"这些模型每次请求所消耗的基础设施资源远超其前代模型,但由于漏洞的存在,它们看起来成本很低。当GitHub修复该漏洞后,限制值骤然回归原始配置。对于正常使用流程的用户来说,这些限制值突然变得极为苛刻——被锁定长达181小时,编程智能体任务被强制中断,既无恢复路径,Pro+以上也没有更高的升级套餐可选。"
Kir认为,GitHub的容量危机源于其定价结构的瓦解。过去,调用高级模型所产生的基础设施成本大致相当,但对于最新的前沿模型而言,情况已大相径庭。
"销售单元——订阅、套餐层级——已与实际成本单元脱钩。"他写道。
这与GitHub在承认漏洞修复导致预期使用模式被打破时的解释本质上一致,GitHub将其归因于"新型模型更高的Token使用强度"。
一位化名Delsin-Yu的用户在限速讨论帖中也发表了类似猜测:"GitHub的补贴力度似乎已经到了不可持续的程度。因此,这感觉与其说是一个漏洞,不如说是一个商业决策……"
截至发稿,GitHub未回应置评请求。
Q&A
Q1:GitHub Copilot限速问题是怎么回事?
A:GitHub发现其限速系统对Claude Opus 4.6和GPT-5.4等新模型存在Token计数漏洞,导致这些模型实际消耗的资源被严重低估。漏洞修复后,限速值恢复到原始配置,许多正常使用的用户突然遭遇大幅收紧的限制,甚至被锁定长达181小时,影响正常工作流程。
Q2:GitHub Copilot的Token计数漏洞对用户有什么实际影响?
A:漏洞修复后,用户遭遇了频繁且漫长的限速中断,包括44小时乃至数天的"每周使用限额"锁定。编程智能体任务被强制中断,用户被迫切换到性能更差的Auto模式,项目进展受阻,且没有更高套餐可供升级,用户体验大幅下降。
Q3:GitHub Copilot的定价模型为什么会出现问题?
A:随着前沿模型的演进,新型模型每次请求消耗的基础设施资源远超旧模型,但GitHub的订阅定价并未同步调整。研究者Roman Kir指出,GitHub的"销售单元"(订阅套餐)已与"实际成本单元"完全脱钩,导致大量用户以固定低价消耗了远超预期的资源,使GitHub的补贴模式难以为继。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。