Token成本失控引發行業地震:微軟優步預算數月見底 華爾街急調立場預警泡沫

智通財經
06/10

智通財經APP獲悉,2026年,人工智能(AI)產業在經歷了多年的狂飆突進後,正被一記現實的財務重拳擊中。

隨着各大AI實驗室悄然結束對Token調用成本的大幅補貼,一場由成本激增引發的連鎖反應正在從硅谷的代碼庫蔓延至華爾街的交易大廳。從微軟(MSFT.US)緊急叫停內部AI項目,到優步(UBER.US)數億美元預算一個季度內灰飛煙滅,再到富國銀行策略師發出「亢奮行情終結」的明確警告,AI的商業化進程正在經歷一場嚴峻的「壓力測試」。

華爾街拉響警報:最迫在眉睫的利空論點

富國銀行首席股票策略師Ohsung Kwon本周二在接受採訪時直言,由AI驅動的市場反彈正面臨「迫在眉睫」的威脅,而這顆雷的核心正是「Tokenmaxxing」時代的終結。

Kwon將近期科技股的拋售描述為「對投資者的警醒」,並強調「沒有任何東西能每天都永遠上漲」。他指出,最初的拋售源於倉位調整而非基本面惡化,但眼下最堅硬的看空邏輯在於:AI實驗室不再補貼成本,導致Token價格飆升。這已促使沃爾瑪(WMT.US)、優步等大型企業敲響警鐘,反映其AI預算在短短幾個月內就已瀕臨耗盡。

Kwon警告稱:「這本質上是AI需求的直接體現。如果需求開始至少趨於平穩,對AI交易而言將是重大的利空。」

基於此判斷,富國銀行已將其整體立場從今年4月的看多,果斷轉向「堅定中性」。該機構並未建議客戶全面清倉AI資產,而是主張通過買入看跌期權或賣出看漲期權的方式立即建立對沖。在防禦性配置上,Kwon特別提及了滯漲明顯的醫療保健板塊,認為一旦AI驅動的波動持續,該板塊有望受益。

Token賬單爆炸:從代碼助手到天價消耗

這輪成本危機的直接導火索,是AI調用計價單位——Token價格的急劇攀升。據統計,過去六個月裏,針對前沿模型的高質量推理服務Token定價已累計上漲約40%。這背後是高性能GPU的持續受限、數據中心能耗成本15%-20%的上漲,以及需求端的爆炸式增長共同作用的結果。

儘管模型提供商通過優化技術在一年內實現了約2倍的效率提升,但同期Token的溢價幅度高達40%-50%,這導致依賴外部API的應用型企業淨成本實際暴增了20%-30%。

相關報道更是將此指向了一場可能的價格合謀與「成癮性」測試。近期,OpenAI在發布GPT-5.5時直接將Token價格翻倍,達到每百萬輸入Token收費5美元、輸出Token收費30美元。谷歌(GOOGL.US)緊隨其後,新推出的Gemini Flash 3.5模型價格是前代的3至6倍。更為嚴峻的是,能夠執行多步驟複雜任務的智能體工具,其Token消耗速度是普通聊天機器人的數十倍,這種量級的疊加令企業IT預算瞬間失守。

分析認為,AI公司正試圖錨定「替代人工成本」的邏輯來維持高價:「讓AI幹活每小時成本約30美元,僱佣一名員工每小時則需40美元外加福利。在AI比人便宜的敘事下,未來AI的定價可能不再按Token計算,而是直接標榜為‘替代一名全職員工的成本’。」然而雪上加霜的是,主要模型開發商目前均處於嚴重虧損狀態,根本不存在降價競爭的利潤空間。

科技巨頭「預算失火」:微軟撤退與優步的34億美元教訓

不期而至的成本洪峯率先沖垮了科技巨頭們的內部預算防線。據報道,微軟早前就已做出了一項罕見決定:在啓動僅六個月後,宣佈將於今年6月30日終止其內部「體驗與設備」部門對Claude Code的集體許可。該試點項目於2025年12月高調推出,卻因Token消耗量帶來的賬單完全超出預期而迅速崩盤。如今,微軟不得不強令其工程師撤回至使用GitHub Copilot CLI。

無獨有偶,優步的遭遇更像是一場AI財政災難。優步首席技術官Paraveen Neppalli Naga近期坦承,公司在2026年為AI撥備的34億美元年度預算,竟在今年4月便已全部耗盡。在向公司5000名工程師推出Claude Code編碼助手後,月度活躍使用率飆升至85%-95%。失控的使用強度帶來了災難性的賬單:每名工程師的月均API調用成本在500至2000美元之間。這種「不設上限」的消耗速度,令管理層措手不及。

英偉達(NVDA.US)應用深度學習副總裁Bryan Catanzaro近期接受採訪時也承認了行業的普遍焦慮:「在我帶領的團隊中,計算成本已經遠遠超過了人員成本。」輿論場上,關於AI泡沫的爭論也被再次點燃,有行業觀察者評論稱:「成本問題如今已是房間裏的大象,每個人都聲稱自己有追蹤能力,但幾乎沒人真正關注賬單。」

IPO行業大分化:應用層遭擠壓,基礎設施商躺贏

Token成本的飆升對於計劃在2026年底衝刺IPO的明星AI企業,如Anthropic和Perplexity等,構成了最不願見到的估值殺手。風險指出,與對虧損容忍度較高的私募市場不同,公開市場投資者將對毛利率和盈利路徑進行極其嚴苛的審視。當核心輸入成本以半年40%的速度遞增時,被投企業想要證明收入增速能覆蓋成本通脹變得極其困難。

產業格局正在經歷劇烈的分化:掌握算力命脈的基礎設施提供商正坐享紅利,微軟Azure、谷歌雲、亞馬遜(AMZN.US)AWS以及GPU巨頭英偉達在供應緊張中維持着絕對定價權。而應用層公司則深陷利潤窪地,依賴免費增值模式的消費級AI應用面臨單位經濟模型的崩塌;即便面向企業端的公司擁有更強議價權,在切換成本較低的激烈競爭中也難以輕易轉嫁成本。

為求生存,部分企業開始推行「模型蒸餾」策略,將日常任務分流至便宜的小模型,僅在處理複雜高端查詢時調用昂貴的前沿模型。另有一些企業則在探索為企業客戶提供本地部署選項,將基礎設施成本轉移給用戶。同時,巨頭的整合鐮刀正在舉起,資金雄厚的大廠可以吸收成本以擠壓獨立開發商,微軟與OpenAI的深度集成即是一道難以逾越的成本護城河。

硬件遠水難解近渴,AI步入「去僞存真」時刻

在成本烈火烹油之際,能夠從根本上降低推理成本的下一代硬件卻仍需漫長的等待。據報道,儘管英偉達收購了芯片初創公司Groq,且AMD(AMD.US)、英特爾(INTC.US)和AWS等均在重新設計專用於降低單次Token成本的AI加速器,但絕大多數硬件預計要到今年下半年才能發布,大規模部署緩解供需至少要等到2027年初至中期。

在這場由供給瓶頸、能源漲價與無底線消耗共同導演的危機中,行業正式步入了告別野蠻增長、直面盈利現實的「去僞存真」階段。正如一位AI公司高管所言,當成本攀升的速度壓倒了一切效率提升,擺在AI產業面前的問題已不再是AI能否改變世界,而是如今這種脆弱的商業模式,是否正站在一觸即潰的泡沫之上。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10