推理算力需求爆發 七牛智能(02567)卡位AI Cloud或迎量價雙增

智通財經
2025/09/12

「我們瞄準的是 AI 推理市場——那裏纔是真正的、萬億美元級別的機會。訓練規模很大,但推理將被用於所有場景。人們正在耗盡可用的推理算力容量。」甲骨文創始人Larry Ellison在財報會議上的這句話,以及剩餘履約義務(RPO)飆升至4550億美元的佐證,幫他在一夜之間登頂全球首富。

早在2024年AI應用爆發之時,Larry Ellison就已多次做過「推理會被用於一切」預判。AI訓練需求通常是周期性、高強度的資源消耗,通常在超大 GPU 羣上、一次性或周期性發生。只有AI推理需求才是將模型「產品化、服務化」後的持續調用——每天、每秒、在千萬級用戶或千百個自動化系統中被不斷觸發,這種常態化、大量化的資源佔用將帶來AI雲服務的持續增長。

智通財經APP獲悉,近期,七牛智能(02567)在財報中公布AI相關收入達1.84億元,貢獻了總收入的22.2%。相關業務負責人則表示,公司AI相關收入主要集中於AI推理服務和算力資源上,在8月初AI相關用戶突破萬人的基礎上,近期得益於可調用的大模型數量超過50個,涵蓋了LLM推理模型、工具調用、AI編程、推理接口支持Claude CodeAI等功能,七牛智能AI相關用戶已達15000人。

要承接AI推理需求並不容易,需要在生產環境中不斷降低模型推理請求的端到端延遲、提高吞吐率,快速響應用戶或業務系統的請求,在高請求壓力(QPS——每秒請求數)和TPM吞吐率的要求下,推理算力需求遠超訓練。此外,由於推理模型要給出有用、可操作的答案,需要高質量、可連通的企業數據,企業級、垂直行業級的海量結構化數據資產則是進入「推理時代」的關鍵資源。

得益於七牛智能過去14年以來在音視頻雲服務上的積累,七牛智能低延遲、高吞吐的全球實時節點、海量存儲能力,以及將私有的音視頻異構數據通過向量化、Private LLM 接入等技術,安全地「向推理模型暴露」,這些能力都將反哺七牛智能的AI雲服務第二增長曲線,在推理算力的價值鏈中佔據上游數據提供與中游算力基礎設施的雙重位置,從而拿到長期可觀的推理算力營收與服務費,實現服務量價的雙重增長。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10