人工智能淘金熱正在迅速耗盡一種AI開發者不可或缺的資源:算力。
這場嚴重的算力緊缺已經讓重度用戶陷入焦慮,迫使企業放棄部分產品,並引發服務穩定性問題。這些問題為AI熱潮敲響了警鐘——正當海量用戶開始依靠先進AI工具提升生產力時,算力瓶頸卻可能限制這些強大新工具的實際效用。
過去幾個月,「智能體AI」需求呈現爆發式增長。這類自主型AI工具能獨立完成各類任務,從編寫軟件代碼到為房產經紀人安排看房行程。企業正爭相搶佔算力資源,以服務不斷擴大且使用強度顯著提升的用戶群體。
「所有人都在談論石油,但我認為全球真正短缺的是Token。」洛杉磯工程師兼科技投資者Ben Pouladian表示。Token是AI中用於衡量任務消耗算力的計量單位。「如今的AI早已不只是我們站在冰箱前問菜譜的聊天機器人,它在統籌任務,變得越來越智能。」
這一切都指向了科技繁榮史上反覆出現的經典問題:從19世紀鐵路擴張到21世紀初電信與互聯網爆發,需求增速始終遠超企業獲取資源、搭建基礎設施的速度。歷史上,漲價往往是解決供應緊缺的唯一手段,但此舉對前沿AI公司而言風險巨大——它們正為爭奪用戶展開激烈競爭。
用於訓練和運行AI模型的圖形處理器(GPU)時租價格自去年秋季以來大幅飆升。熱門聊天機器人Claude及其爆紅的編程工具Claude Code的開發公司Anthropic近期頻繁遭遇服務中斷。該公司已開始在高峯時段對用戶實行Token用量限制,但這一措施引發大量用戶抱怨,稱自己很快就觸達用量上限。
據報道,OpenAI叫停其視頻生成應用Sora,部分原因便是騰出算力,以支持代號為Spud的全新AI模型驅動的編程與企業級產品。
OpenAI面向企業用戶的API平台Token用量從去年10月的每分鐘60億飆升至3月下旬的150億。
「我確實花了大量時間尋找一切能臨時調用的算力。」OpenAI首席財務官薩拉・弗萊爾在近期一次面向投資者的公開視頻採訪中表示,「由於算力不足,我們眼下正被迫放棄一些項目,做出非常艱難的取捨。」
去年年底,規模最大的上市AI雲計算公司之一CoreWeave將價格上調逾20%,並要求小型客戶簽訂至少三年的服務合約,此前這一期限僅為一年。美國銀行分析師上月末恢復對該公司的評級並給予「買入」評級,稱其服務需求至少在2029年前都將持續供不應求。
紐約數據提供商Ornn的數據顯示,近幾個月來,英偉達全系列GPU在雲端數據中心的現貨租賃價格均大幅上漲。Ornn Compute價格指數顯示,英偉達最先進的Blackwell系列芯片單小時租金已達4.08美元,較兩個月前的2.75美元上漲48%。
自2月中旬以來,Anthropic全系統頻繁宕機,部分企業客戶已轉而使用其他AI廠商的模型。
軟件開發平台Retool創始人兼首席執行官David Hsu表示,他原本更傾向使用Anthropic的Opus 4.6模型驅動公司的AI智能體工具,因為他認為這是最適合企業場景的模型。但他近期已切換至OpenAI的模型。「Anthropic的服務一直在頻繁中斷。」
互聯網核心服務的可靠性通常用「幾個九」衡量,四個九即99.99%的在線率,也是軟件公司對客戶的常見承諾。截至4月8日,Anthropic的Claude API近90天在線率僅為98.95%。
「這很不正常。」AI推理初創公司Baseten聯合創始人兼首席技術官Amir Haghighat表示,「想想AWS、數據庫、RDS或Stripe,它們都需要極高的穩定性和在線率。但AI領域目前並非如此,這不是你希望從為應用提供智能能力的公司那裏獲得的服務質量。」
在服務頻繁中斷的同時,Anthropic正經歷爆發式增長。2025年末,該公司年度營收年化規模達90億美元;到今年2月,這一數字飆升至140億美元;兩個月後再度翻倍,達到300億美元。
3月下旬,Anthropic突然宣佈,將在太平洋時間工作日早5點至11點的高峯時段限制用戶Token消耗額度。用戶紛紛在社交平台抱怨。一位用戶在X上寫道:「我好幾周都沒觸達Claude Code限額,結果這周45分鐘就用完了。」
「我們正全力滿足Claude日益增長的需求。」Claude Code負責人兼開發者鮑里斯・切爾尼在X上表示,「算力是我們審慎管理的資源,我們會優先保障使用產品與API的客戶。」
責任編輯:陳鈺嘉