智通財經APP獲悉,據知情人士透露,OpenAI 已同意在未來三年內向芯片初創公司 Cerebras 支付超過 200 億美元,以使用搭載該公司芯片的服務器。根據協議,這位 ChatGPT 的開發商還可能獲得該公司的股權。
這一進展正值 OpenAI 試圖在人工智能競賽中保持領先地位並滿足日益增長的需求之際。今年 1 月,該公司曾同意在三年內從 Cerebras 購買高達 750 兆瓦的計算能力,交易估值超過 100 億美元。
知情人士透露的承諾金額已經超過了此前報道的 OpenAI 與該芯片製造商達成的協議。
該交易凸顯了行業對運行「推理」(即 AI 模型生成響應的過程)所需算力的需求日益增長。目前,各家公司正競相開發推理模型和應用,旨在推動 AI 的更廣泛採用。
報道稱,總部位於加利福尼亞州桑尼維爾的 Cerebras 最快可能於周五披露此前未公開的與 OpenAI 協議的部分內容。
根據協議,OpenAI 將獲得 Cerebras 的少數股權認股權證,其持股比例可能會隨着支出的增加而上升。報道補充稱,OpenAI 還同意向 Cerebras 提供約 10 億美元,以幫助資助運行其 AI 產品的數據中心的建設。
報道還指出,OpenAI 未來三年的總支出可能達到 300 億美元,這可能會轉化為代表 Cerebras 高達 10% 股份的認股權證。
推理需求的爆發
在人工智能發展的早期,業界的目光大多聚焦在「訓練」上。然而,隨着OpenAI與Cerebras達成高達300億美元的算力協議,一個明確的信號已經釋放:AI行業的競爭重心正從「模型如何變聰明」轉向「如何讓聰明變得廉價」。
算力的主戰場,正在向「推理」大規模遷徙。
行業數據顯示,到2026年,推理帶來的算力增量佔比將達到三分之二,未來更將超過80%。增長速度同樣驚人,根據OpenRouter最新數據測算,僅4月初一周內,全球AI大模型總調用量就達到27萬億Token,按月增長18.9%,其中中國AI大模型周調用量達12.96萬億Token,連續五周超越美國。
與此同時,推理的門檻也在快速下降。斯坦福2025人工智能指數報告顯示,達到GPT-3.5同等性能的推理成本在兩年內下降了280倍。需求在爆發,成本在驟降,兩股力量疊加,正在為AI的規模化應用鋪平道路。
訓練成本是固定的、可預測的資本開支。但隨着用戶量破億,每一次ChatGPT的回答、每一段視頻的生成都在產生實時費用。這種運營成本隨着用戶增長呈線性上升。
專家預測,未來AI產業90%以上的算力開銷將發生在推理階段。對於OpenAI這樣的企業來說,如果不能把單次推理的成本壓到極致,其商業模式的護城河將極其脆弱。
訓練需要極強的通用性能,而推理更看重能效比和延遲。這給了一批像Cerebras、Groq這樣的初創公司,以及各大雲廠商自研芯片(如谷歌TPU、AWS Inferentia)巨大的生存空間。