大模型和AI芯片聯合突圍的中國敘事

中國經營網
19小時前

  2025年年初,中國AI大模型初創公司深度求索因發佈開源推理大模型DeepSeek-R1而在全世界一鳴驚人,猶如一顆深水炸彈,打破了由OpenAI、Anthropic、谷歌等國外豪門所把持的全球頂級大模型俱樂部的平靜。此後的一整年,DeepSeek的每一個動作,都成為全球大模型市場的焦點。

  不過,對於中國大模型生態圈而言,深度求索的「鮎魚效應」更體現在其讓FP8(8位浮點數)這種低精度格式獲得全行業認可,一方面攪動了頂級大模型俱樂部的世界格局,另一方面也力挺了國內AI芯片的發展。

  「2025年國內AI芯片行業呈政策驅動、需求爆發、國產替代深化的態勢,市場規模與國產化率雙升。」覆盤2025年,啱啱在香港聯合交易所通過聆訊的國內GPU廠商天數智芯相關人士對《中國經營報》記者如此表示。

  需要指出的是,2025年不斷更新的國內大模型成為國產AI芯片發展的一股助力,尤其是開源模型。「以DeepSeek為代表的國產大模型的優秀表現加快了AI技術在行業的落地速度和廣度,在算力國產化大背景下,國內GPU廠商的市場空間被極大拓展。」2025年12月5日已在科創板正式上市的摩爾線程(688795.SH)方面對記者表示,「2025年國內大模型的發展對國產AI芯片行業來說是強催化劑,影響顯著且持續。」

  天數智芯上述人士也有類似感受:「在生態端,模型廠商與芯片企業聯合優化成常態,開源模型降低適配門檻,加速‘芯片—模型—應用’閉環生態形成。」

  誠然,雖然國內AI芯片企業與國際龍頭之間仍有差距,但回望國產AI芯片敘事脈絡,2025年一定會是個重要節點,因為這一年國產GPU行業已經邁入商業化與規模化的關鍵時期。

  降低算力需求通過軟件提升效能

  芯片,是AI所需算力的硬件基礎,而開源模型使得AI的部署和使用成本大大降低。在AI推理方面,國內各類AI芯片百花齊放。

  據不完全統計,包括華為升騰、崑崙芯、海光信息沐曦股份(688802.SH)、摩爾線程、天數智芯等多家AI芯片廠商相繼宣佈了對DeepSeek模型的快速部署和訓練,使得國產AI芯片能夠在推理任務中與英偉達GPU競爭,甚至在某些場景中表現更好。

  「DeepSeek的成功表明,通過模型壓縮、稀疏計算、混合精度訓練等技術手段降低算力需求,可以在一定程度上彌補硬件性能不足。」摩爾線程方面表示,這為國內芯片提供了軟硬件協同設計的新思路,「證明了在硬件性能短期內難以趕超的情況下,通過軟件層面的創新仍可提升整體計算效能」。

  同時,深度求索還觸發了下一代AI芯片的「底層代碼」——FP8低精度格式,該格式對計算精度要求相對較低,一定程度上降低了對晶體管密度的依賴,意味着不再那麼迫切需求世界上最先進的芯片製造工藝。

  而深度求索在成功訓練出世界首個使用FP8精度的開源大模型DeepSeek-V3後,又在DeepSeek-V3.1中使用了UE8M0 FP8 Scale的參數精度。

  摩爾線程方面指出,DeepSeek在混合精度訓練方面的成功,展示了低精度計算在AI訓練中的潛力,「國內芯片廠商可以借鑑這種模式,優化芯片的計算單元,支持更靈活的精度配置」。

  根據公開資料整理,截至2025年12月,國內已有包括摩爾線程、燧原科技、沐曦股份、壁仞科技、天數智芯、礪算科技、海光信息(688041.SH)、寒武紀(688256.SH)、中昊芯英、芯原股份(688521.SH)、崑崙芯等10餘家廠商推出支持FP8精度的AI 芯片,其中摩爾線程、燧原科技、沐曦股份、寒武紀處於領先地位,均已實現原生FP8支持並完成與DeepSeek這些主流大模型的適配。

  專注於推理應用平替4090沒問題

  隨着國產FP8標準的推廣,國產AI芯片在大模型部署方面正逐步縮小與英偉達的差距。

  「需求端,基座大模型與行業定製化模型催生高端訓推芯片及高性價比推理芯片需求,擴大國產芯片替代空間。技術端,UE8M0 FP8量化這些模型創新倒逼芯片適配,推動硬件架構與算子庫升級。」天數智芯方面表示。

  「2025年,我們一直在加緊對國產AI芯片的配合和小規模測試。這一過程中最直觀的感受是,國產AI芯片的迭代速度在不斷攀升,無論是適配性、兼容性還是穩定性,都有明顯的提升。我們發現,目前很多過去常用的國外通用芯片的型號,已經完全能用國產GPU進行平替。」國內一家音樂大模型初創公司表示。

  該公司還表示,經過相關測試,在推理上,國產GPU平替英偉達4090是沒問題的。同時,在政策支持下,使用國內AI芯片的成本也有一定優勢。

  根據摩根士丹利2025年12月在亞洲市場的實地調研,中國AI加速器市場正出現新的路徑分化。部分中國本土AI芯片設計公司開始主動調整技術路線,通過開發相對中端規格的產品,以專注於推理應用。

  該調研還指出,中國AI計算的側重點正在從訓練端加速向推理端遷移。

  而內存供應鏈信息同樣印證了推理需求的興起。摩根士丹利指出,新一代國產AI推理芯片正加速採用LPDDR作為主要配套存儲方案,以替代供應緊張且成本高昂的HBM。

  如何從「可用」到「好用」

  知名股權研究機構Bernstein Research在2025年12月發佈的一份報告中預測,華為與英偉達在中國AI芯片市場各佔40%份額,形成雙雄並立格局。到2026年,華為份額將進一步上漲至50%,英偉達萎縮至8%,而寒武紀將取得9%的市場份額。

  值得注意的是,2025年8月底,作為A股較為稀缺的AI芯片標的,寒武紀股價一度最高達1595.88元/股,一舉超過貴州茅台,成為A股股價最高的個股。

  而GPU作為AI芯片的主要技術路線,國內GPU行業在2025年12月迎來上市熱潮:12月5日,摩爾線程科創板上市,創2025年科創板募資規模最大的IPO(募資規模約80 億元);12月17日,沐曦股份登陸科創板,首日股價漲幅692.95%,單籤盈利36.26萬元刷新A股抽新股紀錄。

  除科創板外,港交所則成為國產GPU廠商搶灘資本市場的另一個選擇。近期,壁仞科技、天數智芯都通過港交所上市聆訊,「港股GPU第一股」也就要呼之欲出。

  然而,這些體現的是國產GPU行業在資本層面的繁榮。業界多認為,2025年國產AI芯片已實現「可用」,但性能、能效仍落後國際競品。

  「如果要說(國產AI芯片)還有哪部分有所欠缺,目前比較明確的需求是希望有更大顯存的版本,來滿足我們模型訓練的需求。」前述國內音樂大模型初創公司表示。

  那麼,國產AI芯片從「可用」到「好用」的關鍵突破點是什麼?

  對此,摩爾線程方面表示,接下來的市場競爭焦點正從「能用」全面轉向「好用」,決勝於綜合產品力與生態生命力。

  首先在產品層面,競爭超越了單純的算力指標,進入了「綜合效率」的比拼。「客戶不僅要求高算力,更追求極致的能效比、更高的算力利用率、更優的軟件開發體驗,其根本目的是降低總體擁有成本(TCO)並獲取明確的投資回報。因此,提供高性價比的全棧解決方案,而非單一硬件,將成為關鍵。」摩爾線程方面表示。

  其次在生態層面,挑戰更為根本。「在算力供應快速向國產化轉移的過程中,國產GPU面臨兩大考驗:一是能否無縫兼容現有的主流軟件與開發習慣,確保平滑遷移,這是入場的基礎;二是在此之上,能否展現出持續的自主創新能力,通過提供獨特的價值吸引開發者,從‘生態兼容者’逐步成長為‘生態定義者’。這要求廠商必須具備強大的戰略定力,堅持長期主義,持續投入資源耐心打磨生態,做難而正確的事。」摩爾線程方面如此指出。

  還是在2025年12月,美國政府已批准英偉達向中國出售H200芯片,在國內的AI算力生態中激起漣漪。近日還有市場消息稱,英偉達已告知中國客戶,計劃於2026年2月中旬向他們交付H200。

  面對英偉達仍佔據全球超70%的市場份額,且在高端訓練芯片領域仍無替代方案的現狀,2026年若海外高端芯片供應變化,國產AI芯片的「換道超車」是繼續在推理端深耕,還是必須在訓練端實現技術突破?

  對此,天數智芯表示,2026 年國產AI芯片「換道超車」,推理端要聚焦爆發場景,推出高性價比、低功耗芯片,構建「芯片—模型—解決方案」生態閉環;訓練端則需漸進式突破,先攻克中大規模訓練,再聯合模型廠商優化框架,同時加速核心IP自主與供應鏈自主。

  「關鍵在於平衡短期市場份額與長期競爭力,推理端是快速擴大份額的主陣地,訓練端是構建核心競爭力的關鍵,二者並行不可或缺。」天數智芯表示。

(文章來源:中國經營網)

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10