Token成本失控引发行业地震:微软优步预算数月见底 华尔街急调立场预警泡沫

智通财经
Jun 10

智通财经APP获悉,2026年,人工智能(AI)产业在经历了多年的狂飙突进后,正被一记现实的财务重拳击中。

随着各大AI实验室悄然结束对Token调用成本的大幅补贴,一场由成本激增引发的连锁反应正在从硅谷的代码库蔓延至华尔街的交易大厅。从微软(MSFT.US)紧急叫停内部AI项目,到优步(UBER.US)数亿美元预算一个季度内灰飞烟灭,再到富国银行策略师发出“亢奋行情终结”的明确警告,AI的商业化进程正在经历一场严峻的“压力测试”。

华尔街拉响警报:最迫在眉睫的利空论点

富国银行首席股票策略师Ohsung Kwon本周二在接受采访时直言,由AI驱动的市场反弹正面临“迫在眉睫”的威胁,而这颗雷的核心正是“Tokenmaxxing”时代的终结。

Kwon将近期科技股的抛售描述为“对投资者的警醒”,并强调“没有任何东西能每天都永远上涨”。他指出,最初的抛售源于仓位调整而非基本面恶化,但眼下最坚硬的看空逻辑在于:AI实验室不再补贴成本,导致Token价格飙升。这已促使沃尔玛(WMT.US)、优步等大型企业敲响警钟,反映其AI预算在短短几个月内就已濒临耗尽。

Kwon警告称:“这本质上是AI需求的直接体现。如果需求开始至少趋于平稳,对AI交易而言将是重大的利空。”

基于此判断,富国银行已将其整体立场从今年4月的看多,果断转向“坚定中性”。该机构并未建议客户全面清仓AI资产,而是主张通过买入看跌期权或卖出看涨期权的方式立即建立对冲。在防御性配置上,Kwon特别提及了滞涨明显的医疗保健板块,认为一旦AI驱动的波动持续,该板块有望受益。

Token账单爆炸:从代码助手到天价消耗

这轮成本危机的直接导火索,是AI调用计价单位——Token价格的急剧攀升。据统计,过去六个月里,针对前沿模型的高质量推理服务Token定价已累计上涨约40%。这背后是高性能GPU的持续受限、数据中心能耗成本15%-20%的上涨,以及需求端的爆炸式增长共同作用的结果。

尽管模型提供商通过优化技术在一年内实现了约2倍的效率提升,但同期Token的溢价幅度高达40%-50%,这导致依赖外部API的应用型企业净成本实际暴增了20%-30%。

相关报道更是将此指向了一场可能的价格合谋与“成瘾性”测试。近期,OpenAI在发布GPT-5.5时直接将Token价格翻倍,达到每百万输入Token收费5美元、输出Token收费30美元。谷歌(GOOGL.US)紧随其后,新推出的Gemini Flash 3.5模型价格是前代的3至6倍。更为严峻的是,能够执行多步骤复杂任务的智能体工具,其Token消耗速度是普通聊天机器人的数十倍,这种量级的叠加令企业IT预算瞬间失守。

分析认为,AI公司正试图锚定“替代人工成本”的逻辑来维持高价:“让AI干活每小时成本约30美元,雇佣一名员工每小时则需40美元外加福利。在AI比人便宜的叙事下,未来AI的定价可能不再按Token计算,而是直接标榜为‘替代一名全职员工的成本’。”然而雪上加霜的是,主要模型开发商目前均处于严重亏损状态,根本不存在降价竞争的利润空间。

科技巨头“预算失火”:微软撤退与优步的34亿美元教训

不期而至的成本洪峰率先冲垮了科技巨头们的内部预算防线。据报道,微软早前就已做出了一项罕见决定:在启动仅六个月后,宣布将于今年6月30日终止其内部“体验与设备”部门对Claude Code的集体许可。该试点项目于2025年12月高调推出,却因Token消耗量带来的账单完全超出预期而迅速崩盘。如今,微软不得不强令其工程师撤回至使用GitHub Copilot CLI。

无独有偶,优步的遭遇更像是一场AI财政灾难。优步首席技术官Paraveen Neppalli Naga近期坦承,公司在2026年为AI拨备的34亿美元年度预算,竟在今年4月便已全部耗尽。在向公司5000名工程师推出Claude Code编码助手后,月度活跃使用率飙升至85%-95%。失控的使用强度带来了灾难性的账单:每名工程师的月均API调用成本在500至2000美元之间。这种“不设上限”的消耗速度,令管理层措手不及。

英伟达(NVDA.US)应用深度学习副总裁Bryan Catanzaro近期接受采访时也承认了行业的普遍焦虑:“在我带领的团队中,计算成本已经远远超过了人员成本。”舆论场上,关于AI泡沫的争论也被再次点燃,有行业观察者评论称:“成本问题如今已是房间里的大象,每个人都声称自己有追踪能力,但几乎没人真正关注账单。”

IPO行业大分化:应用层遭挤压,基础设施商躺赢

Token成本的飙升对于计划在2026年底冲刺IPO的明星AI企业,如Anthropic和Perplexity等,构成了最不愿见到的估值杀手。风险指出,与对亏损容忍度较高的私募市场不同,公开市场投资者将对毛利率和盈利路径进行极其严苛的审视。当核心输入成本以半年40%的速度递增时,被投企业想要证明收入增速能覆盖成本通胀变得极其困难。

产业格局正在经历剧烈的分化:掌握算力命脉的基础设施提供商正坐享红利,微软Azure、谷歌云、亚马逊(AMZN.US)AWS以及GPU巨头英伟达在供应紧张中维持着绝对定价权。而应用层公司则深陷利润洼地,依赖免费增值模式的消费级AI应用面临单位经济模型的崩塌;即便面向企业端的公司拥有更强议价权,在切换成本较低的激烈竞争中也难以轻易转嫁成本。

为求生存,部分企业开始推行“模型蒸馏”策略,将日常任务分流至便宜的小模型,仅在处理复杂高端查询时调用昂贵的前沿模型。另有一些企业则在探索为企业客户提供本地部署选项,将基础设施成本转移给用户。同时,巨头的整合镰刀正在举起,资金雄厚的大厂可以吸收成本以挤压独立开发商,微软与OpenAI的深度集成即是一道难以逾越的成本护城河。

硬件远水难解近渴,AI步入“去伪存真”时刻

在成本烈火烹油之际,能够从根本上降低推理成本的下一代硬件却仍需漫长的等待。据报道,尽管英伟达收购了芯片初创公司Groq,且AMD(AMD.US)、英特尔(INTC.US)和AWS等均在重新设计专用于降低单次Token成本的AI加速器,但绝大多数硬件预计要到今年下半年才能发布,大规模部署缓解供需至少要等到2027年初至中期。

在这场由供给瓶颈、能源涨价与无底线消耗共同导演的危机中,行业正式步入了告别野蛮增长、直面盈利现实的“去伪存真”阶段。正如一位AI公司高管所言,当成本攀升的速度压倒了一切效率提升,摆在AI产业面前的问题已不再是AI能否改变世界,而是如今这种脆弱的商业模式,是否正站在一触即溃的泡沫之上。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10