我们早已知晓这一变化即将到来,而这一天终于在本周一正式落地。GitHub已正式废弃Copilot的高级请求模型,转而采用基于Token的计费系统,将用户的付费金额与实际使用量直接挂钩。
这一转变酝酿已久,背后是开发者使用Copilot方式发生根本性变化的驱动。Copilot最初于2021年作为一款编辑器内的代码自动补全工具亮相,如今已发展成为一个能够处理跨整个代码库的长时间自主编程会话的综合平台。
旧模式的终结
此前,Copilot将固定月度订阅费与所谓的"高级请求单元"结合使用——这一配额用于管理对计算密集型功能的访问权限,例如高级对话或长时间运行的智能体任务,但并未将其与成本直接挂钩。GitHub在这种使用模式下承担了大量不断攀升的推理成本,然而随着智能体会话变得更长、需求更高,这一模式逐渐难以为继。
新的信用额度体系
自此次变更起,每个Copilot订阅计划将按月分配GitHub AI信用额度,而非高级请求单元。信用额度的消耗基于Token用量计算,涵盖输入、输出及缓存数据,各模型均已公布对应费率。
各订阅计划的价格保持不变。对于个人订阅用户而言,Pro用户(每月10美元)每月可获得总计15美元的信用额度,Pro+用户(每月39美元)则可获得70美元。每个计划均包含与订阅价格1:1匹配的固定基础额度,以及GitHub表示将随模型定价和AI成本变化而动态调整的可变补充额度。这一所谓的"弹性额度"补充部分是在用户反映原始基础额度可能不足以支撑较重的智能体工作负载后引入的。
GitHub母公司微软的产品副总裁Joe Binder明确表示,基础信用额度是永久性的,而弹性部分更多是为应对AI基础设施成本变动而设计的前瞻性措施。
"弹性额度是您包含用量中的可变部分,旨在随AI经济形势的演变而调整,包括模型定价、新模型的推出以及效率的提升。"Binder在5月的一篇博文中写道。
新增顶级计划Copilot Max
与此同时,面向个人用户的全新顶级计划Copilot Max也正式上线,专为深度使用Copilot的开发者而设计。
该计划定价为每月100美元,包含总计200美元的月度信用额度——其中100美元为与订阅价格匹配的基础额度,另加100美元弹性额度。这一配置远超Pro+计划,旨在支持持续、高频的智能体工作,让用户不必频繁触及用量上限。
现有的学生版、Pro及Pro+订阅用户今日即可升级至Max计划;不过,鉴于GitHub正在调配需求,所有个人计划的新用户注册目前仍处于暂停状态,该公司表示预计将在未来数周内重新开放注册。
值得注意的是,对于年度计划订阅者而言,其将继续沿用现有的高级请求系统,直至计划到期后方可切换至新的月度模式。过渡期间,GitHub已为年度订阅用户提高了模型使用倍数。
企业用户的变化
对于企业和商业用户,按席位定价分别维持在每用户每月19美元和39美元不变,信用额度配置与之匹配。但与个人计划不同,商业版和企业版不包含弹性额度——每个席位获得的信用额度与席位价格严格对应,不多不少。为缓解过渡压力,两个层级均可享受至8月份的促销增量信用额度——商业用户每人30美元,企业用户每人70美元。代码补全和下一步编辑建议功能包含在所有付费计划中,不消耗信用额度。
除计费变更外,GitHub还改进了Copilot代码审查的运作方式。代码审查现在除消耗AI信用额度外,还会消耗GitHub Actions分钟数,按与其他Actions工作流相同的每分钟费率计费。组织管理员现可在组织层级设置默认运行器,并自动应用于所有代码库。此前,每个代码库均需单独配置,给较大规模的团队带来了额外负担。
预算管控机制详解
此次变更中最值得关注的方面,或许超越价格本身——那就是全新的预算管控系统。对于大规模管理Copilot的组织而言,其复杂程度可能远超初看。
在新模式下,企业和商业版的信用额度在组织层面统一汇聚,而非按用户单独分配——这意味着重度用户在需要时可以调用更多额度,而轻度用户则可以抵消部分消耗。
共有四项控制机制协同运作,管理信用池的消耗方式以及额度耗尽后的处理逻辑:通用用户级预算、个人用户级预算覆盖、成本中心预算,以及企业级预算。用户级预算始终处于激活状态,并始终执行硬性上限——它限制任何单一用户从共享信用池和任何超量计费中可消耗的总额。其他控制机制仅在共享信用池耗尽、用量进入计量计费区间后才会生效。
最重要的是要理解企业预算的实质含义。它并不限制每月总支出,只限制共享信用池耗尽后产生的计量超额费用。根据GitHub文档中的示例,一个拥有400个Copilot Business席位(每用户每月19美元)的组织,无论如何都需支付7,600美元的许可费。在此之上设置5,000美元的企业预算,意味着最高账单为12,600美元,而非5,000美元。
不言而喻,这里涉及诸多细节,一旦管理不善局面可能迅速失控。简而言之,如果用户级预算累计允许的消耗量超出共享信用池的供应量,差额将溢出至计量计费。如果企业预算不足以覆盖这一差额,用户将在触达个人上限之前就被切断服务——GitHub将此称为"剩余空间最小者优先"规则,这可能让管理员猝不及防。
每当用户级预算提高时,企业预算的计算都需要重新审视。举例说明:一位个人预算剩余5美元的用户,可能仅仅因为企业预算只剩1美元就遭到拦截——此时其个人余额已无关紧要。
一位企业用户在Reddit上指出,应对这一切的明智之举是从一开始就将其视为一个FinOps问题。
"我们正在对用量进行FinOps式分析,识别重度用户,规划预算上限,并向开发者普及模型选择、提示词大小和高效使用方面的知识,"该用户写道,同时承认其团队正在探索替代方案,包括直接订阅OpenAI和Anthropic,以及考虑自托管模型。
Token是什么,为何现在需要了解它
从可预测的固定价格转向按量计费,不可避免地会在用户中引发焦虑——他们突然需要考虑一个此前从未在意的问题。在这个案例中,那个问题就是Token,而对许多开发团队而言,现在正是深入了解Token究竟是什么的时候。
这种焦虑已在现实中显现。在Reddit上,部分用户将此次变更定性为一种"诱导式营销"——一位Pro+订阅用户声称,在相同使用量下,其预计账单从39美元飙升至847美元。
"我订阅的是一个无限制的产品,"该用户写道,"现在它变成了按次付费,而那个所谓'慷慨'的配额只够我正常使用两天。这不是我当初购买的产品。"
也有人持更为务实的态度。"GitHub为重度用户提供了太多补贴,一直在亏损,"一位用户写道。他自称曾在单次提示中消耗了200个信用额度——而此前这些工作只花费了他每月40美元配额的一小部分,彼时约可发起1,500次请求。
他承认,从这个角度看,GitHub的决定确实难以反驳。
那么,用户究竟在为什么付费?Token是AI模型处理的基本文本单元,大约相当于三到四个字符,或约四分之三个单词。与Copilot的每次交互都会消耗Token:发送给模型的内容消耗输入Token,模型返回的内容消耗输出Token,跨会话存储和复用的上下文消耗缓存Token。在旧的高级请求模型下,这一切对用户既不可见也无关紧要。而在新模式下,它直接决定账单金额。
关键在于,不同模型的费用并不相同。GitHub已为Copilot中所有可用模型发布了完整的每Token定价明细,差异显著。在OpenAI一侧,GPT-5 mini是轻量级选项,每百万输入Token仅需0.25美元;而更强大的GPT-5.5每百万输入Token则需5.00美元,是前者的20倍。在Anthropic一侧,Claude Haiku 4.5每百万输入Token费用为1.00美元,而专为高强度任务设计的新发布模型Claude Opus 4.8则高达每百万输入Token 5.00美元。简而言之,模型选择如今对团队支出有着直接且可见的影响——对每项任务都选用最强大的模型,不再是成本中性的行为。
好消息是,团队可以为不同任务选择相应的模型,Copilot还提供自动模式,根据当前任务将请求路由至最合适的模型。对于简单查询,这可能意味着选用更便宜的轻量模型;对于复杂的多步骤智能体任务,则可能意味着更强大——也更昂贵的模型。
熟悉定价表,并思考特定任务实际需要哪种模型,将成为未来管理Copilot支出的重要功课。
Q&A
Q1:GitHub Copilot新的Token计费模式是怎么运作的?
A:新模式下,每个Copilot订阅计划按月分配GitHub AI信用额度,消耗量基于Token用量计算,涵盖输入、输出和缓存数据。不同模型费率不同,例如GPT-5 mini每百万输入Token仅需0.25美元,而GPT-5.5则需5.00美元。用户可手动选择模型,也可开启自动模式让Copilot路由至合适的模型。
Q2:GitHub Copilot各订阅计划的价格和信用额度是多少?
A:各计划价格不变。Pro用户每月10美元,获15美元月度信用额度;Pro+用户每月39美元,获70美元;新推出的顶级计划Copilot Max每月100美元,获200美元信用额度。商业版每用户每月19美元,企业版每用户每月39美元,均不含弹性额度。代码补全和下一步编辑建议不消耗信用额度。
Q3:企业管理员如何控制GitHub Copilot的预算?
A:企业版提供四层预算控制:通用用户级预算、个人用户级预算覆盖、成本中心预算和企业级预算。用户级预算始终有效,执行硬性上限;其他控制仅在共享信用池耗尽后生效。企业预算只限制超额计量费用,不限制总月度支出。管理员需注意"剩余空间最小者优先"规则,及时根据用户级预算调整重新核算企业预算上限。
好文章,需要你的鼓励
再发一期Anthropic哲学家Amanda Askell的访谈。熟悉她的朋友应该知道,她的工作是给Claude写"性格"。Anthropic那份84页的Claude宪法文件,公司内部叫"灵魂文档"(soul document),主笔就是她。
纽约大学与KAIST联合研究发现,顶尖AI视频理解系统在专为"视觉状态追踪"设计的VSTAT基准上得分仅44.4%,接近随机猜测,核心瓶颈是视觉感知而非推理能力。
由剑桥大学衍生公司DIOSynVax开发的AI设计平台,针对所有SARS-CoV-2变体设计的通用疫苗已完成首次人体临床试验,结果令人鼓舞。该疫苗基于全球监测项目收集的冠状病毒基因序列数据,利用AI设计出包含共同特征的"超级抗原"。39名志愿者参与测试,结果显示疫苗安全,并对多种冠状病毒产生免疫响应。研究团队表示,类似方法未来可应用于埃博拉等其他病毒家族的疫苗研发。
MindZero是约翰斯·霍普金斯大学与北京大学联合开发的AI系统,无需标注数据,通过自我监督强化学习训练小型语言模型实时推断人类意图,在协助任务中超越多数大型专有模型。