AI写代码太烧钱了:Copilot、Claude一起涨价,不如把程序员请回来?

茶饮消息
Apr 29

程序员们,先别忙着焦虑 AI 会抢走你的饭碗。现在更该焦虑的,可能是你们的 CTO 和 CFO 了:因为让 AI 写代码,实在太烧钱了。

Copilot 和 Claude Code,几乎在同一时间,给行业踩了一脚刹车。

4月28日,GitHub 宣布从 2026 年 6 月 1 日起,GitHub Copilot 将告别“无限畅饮”模式,将 Copilot 从“按请求计费”转为“按使用量计费”。

几乎同一时间,Anthropic 限制了 Claude Code 中 Opus 模型的访问,每月 20 美元的 Pro 用户想继续用?请额外付费。

这就引出了一个绕不开的问题:用 AI 写代码花的钱,哪天会比直接雇一个程序员还贵?如今这个转折点,已经不远了。

从“自助餐”到“按粒收费”

先看看 GitHub Copilot 涨价的程度。

GitHub Copilot 原来的模式是按“请求次数”计费,你问一句“怎么写快排”和让 AI 替你跑一个小时的自主编码会话,消耗的额度是一样的。因此,需要大量“思考”的复杂提示往往会使 GitHub 的成本超过其获得的订阅费收入。GitHub 产品团队首席产品官 Mario Rodriguez 在今天的博客中坦言:“GitHub 已经吸收了太多推理成本,当前模式不可持续。”

这种压力,其实已经开始体现在更早的动作里。GitHub 上周已经释放出一个信号:为了止住持续扩大的亏损,公司暂停了 Copilot、Pro、Pro+ 以及 Student 套餐的新用户注册。

在这样的背景下,计费逻辑开始彻底重写。从 6 月 1 日起,新模式下一切以 token 为单位。GitHub 推出了自己的虚拟计费单位, “GitHub AI Credits”,每个 Credit 价值 0.01 美元。Copilot 用户在使用过程中会消耗输入 token、输出 token 以及缓存 token,这些都会根据所使用的模型分别计价,最终统一折算为 AI Credits。

订阅价格表面上没变:Copilot Pro 仍是每月 10 美元,每月 1000 Credits。Pro+ 是 39 美元,每月 3900 Credits。用完之后,要么设置超额预算继续付费,要么等下个月额度重置。

真正麻烦的是,token 账单很难提前算清。一次请求会“想”多久、调用多少工具、读多少上下文、生成多少内容,用户事前并不知道。GitHub 也意识到这一点,只能先给一点“模糊的可见性”。Rodriguez 透露,公司将在 5 月初推出“费用预览”功能,让用户和管理员在 6 月 1 日正式切换前,能够看到预估成本。

对于按年订阅的用户,可以选择提前取消并按比例退款,或者在订阅到期后降级为 Copilot Free——这些年费套餐将不再支持续订。而且那些坚持用完年费订阅的用户 ,将会明显感受到高端模型价格的上涨。 例如,Anthropic 的 Opus 4.7,在原有按请求计费模式下的倍率为 7.5 倍,未来将提升至 27 倍;OpenAI 的 GPT-5.4,也将从 1 倍上涨到 6 倍。

所以 GitHub 的调整,相当于承认了:之前是在亏本让开发者“薅羊毛”,现在要把高阶模型真正的推理成本转嫁回去。

Anthropic 也一样。 本月初,数百万 OpenClaw 用户发现这款爆火的 AI 代理工具 被 Anthropic 严重限制了。现在 Claude Code 也一并改了规则:每月 20 美元的 Pro 用户想继续用 Opus 模型?得额外付费。负责人 Boris Cherny 也曾直言:“订阅模式本就不是为这种使用强度设计的。”翻译成人话:OpenClaw 这些工具 7×24 小时跑 Agent,我们扛不住了。

轮到用户填这个“无底洞”了

过去几年,AI 公司一直用接近“自助餐”的方式扩张:低价,甚至免费,让更多人先用起来,把规模做大。

在这个阶段,主流做法是按人头收费,本质上是一种“平均成本”的模式。也就是说,不管一个人每天跑几个 agent,还是一周只问两次问题,平台都按同一档订阅费来收。高频用户多出来的成本,会被低频用户摊掉,也会被平台自己吸收。订阅制本质上是在用“平均成本”覆盖这种极不均衡的使用。

可一旦 agent 普及,这个模型就会迅速失效。所以 Copilot 和 Claude Code 现在做的,其实是把过去被平均掉、被平台吸收掉的成本,重新按 token 拆回到每一次真实使用上。

某种程度上,这并不新鲜。 它像是 2010 年代科技繁荣的重演:当年风险投资推动网约车、电商、外卖、即时配送,用补贴换增长。一旦公司站稳脚跟,就开始提价、拓展收入、为投资人兑现回报——当然,也有不少没撑住直接崩盘的。

但 AI 烧钱的速度,比近几十年任何一个行业都快。 AI 公司在全球砸下数据中心,投入数万亿美元,承诺更强的模型、更低的成本、以及“人人可用的 AI”。可现实是,哪怕只是止住亏损都很难,更别说实现投资人期待的回报了。

有外媒在分析这一轮 AI 资本热潮时,援引了 Gartner 的一组数据。分析师 Will Sommer 估算,2024 到 2029 年,全球 AI 数据中心的资本投入将达到 6.3 万亿美元——差不多是美国一年 GDP 的四分之一。为了避免资产减值,厂商需要大约 25% 的投资回报率(像亚马逊微软那种水平)。如果回报低于 7%,就是“对所有投资者的灾难”。

要达到那根最低 7% 的红线,大型 AI 公司到 2029 年需要累计赚出接近 7 万亿美元的 AI 收入,相当于平均每年 2 万亿美元。如果想实现“历史性回报”,这个数字要提高到 8.2 万亿美元。

那这些钱要从哪来?只能靠卖 token。

Token 是 AI 理解和处理数据的最小单位,可以是文字、图片或声音。通常来说,一个 token 大约对应英文中的 3 到 4 个字符,一篇 1500 字的文章大约 2050 个 token。问题是,要赚到每年 2 万亿美元,需要处理的 token 数量大到荒谬。作为对比,谷歌曾透露它每月处理约 1.3 千万亿(quadrillion,也就是 1 后面 15 个零)个 token。把所有厂商加一起,每年大概处理 100 到 200 千万亿个 token。

但 Gartner 算了一下:要实现年入 2 万亿美元,算上每个 token 大约 10% 的利润率,token 的消耗量需要在未来几年增长 5 万到 10 万倍——也就是从现在的每年百万亿级,跳到每年 1 后面 21 个零 那个级别(sextillion,简单说,比现在多五位数)。

问题是,现在的公司根本没有能力处理这么多 token。它们正在拼命建设数据中心,但算力依然紧张。即便有能力处理,它们也面临另一个问题:这些 token 很可能是亏钱的。

Sommer 估算,如果只计算基础设施和电力成本,“每个 token 的利润看起来还算合理”。但随着模型越来越复杂、token 消耗越来越大,这个利润空间正在迅速收窄,甚至消失。而一旦把间接成本算进去——例如扩建算力以及不断训练下一代模型的“天文级”开销——这些利润几乎被完全吞噬。

“当你把下一代模型所需的基础设施成本也算进去,这个模式就越来越站不住脚。”Sommer 预测,市场整合几乎不可避免,每个区域最终可能只剩不超过两家大模型厂商。

所以,慷慨的免费额度时代,也该结束了。对那些免费用户很多的 AI 实验室来说,问题从来不是“要不要变现”,而是“什么时候开始、下手多重”。它们希望 token 用量继续增长,但成本要么自己扛,要么转嫁给用户。这也是为什么如今 GitHub Copilot 和 Anthropic 必须放弃订阅制的原因。

浪费不可避免,成本逼近临界点

AI 公司不得不把成本转嫁给用户,但问题是,很多 token 本来就是被“白烧”掉的:一部分来自技术机制,一部分来自员工内卷。

在 AI 发展的早期,大部分算力成本都花在模型训练上,而推理相对便宜。但随着模型能力提升、系统功能不断叠加,推理阶段的资源消耗已经显著上升。尤其是 AI agent——那些希望能够替用户完成复杂、多步骤任务、而不需要持续人工干预的工具——相比几年前的基础聊天模型,会消耗成倍增长的 token。

你输入一句话,Agent 就在后台工作中消耗大量 token:推演不同路径、启动子 agent 去完成子任务,或者对每一步结果进行验证。这些你根本看不见,但每一笔都算在账单上。更麻烦的是,Agent 一定会产生“无效 token”:走错路退回来、反复检查却不改东西、甚至停下来“给自己写首诗”。整个行业都在努力减少这种浪费,但短时间内没戏。

那这些 token 到底烧在哪了?

首先是最基础的输入 token 和输出 token。输出往往比输入贵 2 到 6 倍——因为生成是串行的,输入可以并行。这个价差不是随便定的,是物理层面的差异,即生成比读取更难。

真正烧钱的是推理 token。当你使用带“深度思考”的模型时,它不会直接给答案,而是先“思考”,生成成千上万 token。一个简单数学问题,最终答案可能只有 200 个 token,甚至只输出一个“42”,但模型内部可能生成了上千甚至几千个推理 token。你的账单是“推理 token + 输出 token”的总和。推理 token 已经成为一个新的市场分层,高级推理,就是更高价格。

还有一类正在拖垮很多 Agent 系统的,是工具调用 token 和系统 token。给模型接入工具时,你必须把工具的 JSON schema 一起发过去。10 个工具,加上完整描述,每次调用就多出 3000~4000 个 token,而且无论是否真用到,成本都会发生。更致命的是 Agent 的循环调用:思考→调工具→读结果→再思考……可能跑 6 到 15 轮。一个 50 token 的用户问题,最终可能消耗超过 10 万 token。不建模的话,最终账单会亲自“教育你”。

除此之外,还有视觉 token(一张截图比发一整页文字还贵)、音频视频 token(一小时会议录音 18 万 token)、结构性 token(这是“看不见的脚手架”:序列开始 / 结束标记、区分 system/user/assistant 的角色 token、batch 处理时的 padding token、以及各种模式触发 token)。

技术上的浪费已经够头疼了,更糟糕的是,一些企业还在主动放大这种浪费。

tokenmaxxing 这个概念最早在硅谷流行起来,但传播速度很快。员工拼命消耗更多 token,以此证明自己“深度拥抱 AI”。Visa 自豪地宣布,它的 token 使用量从 2 月的 1 万亿翻到了 3 月的 2 万亿。摩根大通迪士尼内部甚至设有仪表盘,专门追踪员工用了多少 AI 代币。谁消耗得多,谁就显得更“前沿”。

今年 4 月,Meta 内部出现了一个叫 Claudeonomics 的排行榜,追踪全公司 8.5 万人的 AI token 消耗,只展示前 250 名。为了冲榜,有人让 Agent 跑几个小时,有人一次性跑几十个用例,还有人直接写无限循环脚本——让 AI 不断调用自己,一晚上刷出几十亿 token。30 天内,全公司烧掉了 60 万亿 token,按公开定价估算相当于 9 亿美元。排名最高的个人,一个月账单接近 200 万美元。

这些数字放在一起,会逼出一个更直接的问题:人和 AI,到底哪个更贵?

过去大家默认 AI 便宜,是因为真实成本被补贴和平均掉了。Copilot 每月十几美元、Claude Code 每月几十美元,看起来当然比一个工程师便宜。现在 token 开始逐笔计价,这个账就变了。假设一个工程师年综合成本是 25 万美元,折到每月大约 2 万美元。如果一个 AI 工具每月花 1000 美元,但能稳定替代 5% 以上的工程产出,那就是划算的;如果一个团队每月 token 账单烧到几万、几十万美元,却只换来一些重复尝试和无效产出,那 AI 反而比人贵。

所以真正的问题不是“AI 要不要用”,而是“AI 账单什么时候会超过一个程序员的工资”。

在今年 2 月的一期播客里,硅谷知名天使投资人、All-In Podcast 联合主持人 Jason Calacanis(曾早期投资 Uber、Robinhood 等公司)提出这个问题:token 成本什么时候会超过员工工资?他说,“这个临界点,不是未来,是马上就会发生。”

那些重度使用 AI、长时间跑 agent 的开发者,其实早已到了这个点。

同场的 Chamath Palihapitiya 也提到,他的公司已经开始给开发者设定 token 预算。按他的说法,单个 agent 通过 Claude API 跑起来,一天就可能花掉 300 美元,一年就是 10 万美元。团队必须至少提升 2 倍生产力,才能覆盖“工资 + AI 账单”的总成本。

否则,AI 不是降本工具,而是新的成本黑洞。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10