2026 年 4 月,AI 编程领域的定价模式,发生了一场静默的地震。

coding-plan-to-token-plan-1.png

72 小时内,三家顶级厂商接连出手:

  • ​4 月 20 日​:GitHub 暂停 Copilot Pro/Pro+/Student 新注册,理由是自 1 月以来每周算力成本几乎翻倍。

  • ​4 月 21 日​:Anthropic 短暂将 Claude Code 从 $20/月的 Pro 计划中移除,虽然后来撤回决定,但已对 2% 的新用户进行测试。

  • ​4 月 23 日​:微软正式宣布,2026 年 6 月起 GitHub Copilot 全面转向 token 计费。

  • ​4 月 23 日​:Cursor 紧随其后上线 Pro+ (60)与Ultra(60)与Ultra(200) 阶梯计划,变相取消 Unlimited 模式(基于用量计费)。

这不是某个厂商的独立事件,而是整个行业的结构性信号:​包月“无限量”* coding plan 的时代结束了​。


什么是 Coding Plan?

简单说,就是之前各家 AI 编程工具的“包月制”:

  • Cursor Pro $20/月 —— 500个高级请求,不限 token

  • GitHub Copilot Pro $10/月 —— 300个高级请求,不限 token

  • 国内的厂商甚至只要29元、40元一个月 ……

对用户来说很爽,一个月几十块,AI 随便调,代码随便生成。

但对厂商来说,这笔账越来越算不平。


为什么包月制玩不下去了?

原因很直接:​agent 模式把 token 消耗量拉到了另一个量级​。

以前用 Copilot,主要是补全几行代码,一次几十到几百 token。现在用 Claude Code、Cursor Agent、OpenClawHermes Agent,一次 agent 会话可以跑几百个 tool call,消耗几十万甚至上百万 token。

GitHub 副总裁 Joe Binder 原话:

"Agentic workflows have fundamentally changed Copilot’s compute demands. Long-running, parallelized sessions now regularly consume far more resources than the original plan structure was built to support."

译文:

Agent 工作流从根本上改变了 Copilot 的计算需求。长时间运行、并行化的会话现在通常消耗的资源远超原始计划结构所设计支持的范围。

coding-plan-to-token-plan-2.png
  • 说人话:​你们蹬得太狠了,我们补贴不起了​。😅

一个重度用户,实际消耗的 token 成本可能是 $20 包月费的 ​10 倍​。这不是做生意,而是做慈善。


各家怎么改的?

🇺🇸 国外厂商

🟧 Anthropic(Claude Code):试探底线,小步快跑

  • ​4 月 21 日突袭​:短暂将 Claude Code 从 $20/月​ 的 Pro 计划中剔除,引发开发者抗议后紧急撤回。

  • ​暗度陈仓​:明面上恢复,但已悄悄在 2%​ 的新用户中测试用量限制。

  • ​企业版隔离​:Claude Code 企业版早已独立定价,彻底与个人订阅解绑。

⚡ Cursor:把“无限”拆成阶梯

  • ​价格分层​:Pro $20​ → Pro+ $60​ → Ultra $200/月​。

  • ​用量翻倍​:Pro+ 提供 3 倍​ 标准用量,Ultra 提供 20 倍​ 用量。

  • ​本质暴露​:看似还是包月,实则是“有限 Token 包 + 超额降级”的混合模式。

🌊 Windsurf(Codeium):复制套路,额度封顶

  • ​分级用量​:Pro $20/月​(Standard 标准用量)→ Max $200/月​(Heavy 重度用量)。

  • ​超额补差价​:超出额度后,直接按 API 实时价格计费。

  • ​路线一致​:和 Cursor 几乎一模一样的策略——用高价档位筛选重度用户,用 API 价格兜底成本。


🇨🇳 国内厂商

🧩 阿里云百炼:23 天的“狂欢”与急刹车

  • ​2 月 25 日​:百炼高调发布 ​Coding Plan​,首月仅需 ​7.9 元​。这一波“价格战”直接引爆了开发者圈,羊毛党与极客蜂拥而至。

  • ​3 月 20 日​:仅仅上线 ​23 天​,Lite 基础套餐宣布​停止新购​。显然 7.9 元的包月在 Agent 算力面前就是做慈善。

  • ​4 月 13 日​:彻底关停 Lite 续费入口,连 Pro 套餐也变成了“极难抢购”的稀缺资源。

🐧 腾讯云混元:前脚抢购,后脚转型

  • ​3 月 8 日​:紧跟阿里步伐,推出对标版 ​Coding Plan​。

  • ​3 月中旬​:开启限量抢购模式,Lite 套餐基本“秒空”。然而,火爆销量的背后是算力的不可控。

  • ​3 月下旬​:仅仅半个月后,腾讯云迅速调整策略,​全面推出 Token Plan 并引导转型​。

🌙 Kimi(月之暗面):登月叙事下的算力分层

  • Kimi 的“登月套餐”属于 Coding Plan(包月订阅),但在实际使用中,通过配额、频率与优先级等机制,与主流的 Token/算力计费体系趋于一致。

🐳 DeepSeek:早就掀桌子的“价格屠夫”

  • 当别家还在“包月”和“按量”之间纠结时,DeepSeek 从一开始就是标准的 ​API Token 计费​(百万 Token 几块钱)。

  • 它的出现直接完成了市场教育:Token 本来就不该贵,但也绝不会免费。 它用极低的单价告诉全行业——别再搞虚假的无限包月了,把 Token 价格打下来才是正道。😄


Token Plan 是未来吗?

coding-plan-to-token-plan-3.png

大概率是的。原因有几个:

  • 成本透明
    包月制下,厂商不知道你会用多少,你也不知道自己划不划算。token 计费下,每一分钱花在哪都清清楚楚。

  • 按需付费
    轻度用户不再为重度用户的算力买单。一个月只写几段代码的,花不了几块钱。

  • 倒逼效率
    按 token 计费后,开发者会更注意 prompt 质量、context 管理、缓存复用 —— 这些本来就是好习惯。

  • 厂商能活下去
    这才是最根本的。如果一直补贴,要么涨价,要么砍功能,要么关门。token 计费让商业模式可持续。


对开发者的影响

好消息​:

  • 轻度用户会更便宜

  • 用量透明,不再盲盒

  • 倒逼你写好 prompt,少浪费 token

​坏消息​:

  • 重度用户的成本会显著上升

  • 一个 agent 会话跑几十万次 tool call,账单可能很感人

  • 需要开始关注 token 用量管理了


个人用户应对?

两个实际建议:

  1. 开用量监控

    • 不管用哪家,先把 dashboard 打开,看看自己一个月到底消耗多少 token。

  2. 优化 prompt

    • 少发无关上下文

    • 能用小模型的地方,就不一定非得用大模型


结语

Coding plan 完成了它的历史使命 —— 在 AI 编程工具普及初期,用低价甚至补贴吸引用户、培养习惯。

现在随着习惯养成和龙虾爆火,agent 模式把用量拉爆了,补贴玩不下去了。😅

Token plan 也并非厂商想割韭菜,而是这笔账本算下来根本摊不平。

自助餐结束了,但点菜的时代才刚刚开始。早点适应,早点优化你的工作流。

毕竟,靠 AI 写代码这件事,大概率是回不去了!