國產算力的進擊:百度智能雲將上線三萬卡崑崙芯集羣

數智前線
03-28

3月26日,在博鰲亞洲論壇2025年年會上,百度集團執行副總裁、百度智能雲事業羣總裁沈抖透露,百度智能雲即將上線三萬卡自研國產芯片崑崙芯集羣,同時還在繼續迭代模型。去年,百度已點亮了萬卡的自研芯片崑崙芯P800。這標誌着中國企業在人工智能算力領域,取得了新的重大突破。

而國產三萬卡集羣的啓動和投入生產,爲今年初以來,大模型應用的爆發和技術的進一步訓練,提供了重要的算力保障

與此同時,在當天的論壇上,沈抖呼籲,要把人工智能真正用起來。現在已有六成以上的央國企和百度合作,基於大模型做行業創新,但更多的企業並沒有把大模型用起來。沈抖認爲,中國最大優勢就在於擁有豐富的應用場景,應該抓住這些應用場景,加速大模型的迭代和發展,真正讓中國、讓亞洲、讓更多的人能用上領先的大模型。

01

大模型應用爆發,算力保障成關鍵

數智前線獲悉,百度智能雲即將投產的崑崙芯3萬卡集羣,一方面通過穩定的算力資源供應,避免因外部因素導致的斷供風險,支撐了企業研發和生產的連續性;另一方面,也實現了更低的採購和維護成本,使更多企業,能夠以更低的成本獲得高性能計算資源。

三萬卡大型集羣的出現,也避免了計算資源閒置問題。利用雲廠商的優勢,通過大型集羣,爲衆多企業提供服務,根據不同企業的需求,動態分配計算資源,實現多元算力支撐,企業即開即用。這不僅提高了資源利用率,也降低了企業使用雲服務的成本。

這在當下尤爲關鍵。去年以來,人工智能在深度推理、多模態等方面取得明顯突破。業內的共識是,AI已成爲全球產業變革的核心引擎,今年開年後,正在加速進入千家萬戶和千行百業,推動AI邁入全民普惠時代。AI推理迎來爆發式增長

在這種情況下,大模型的應用落地和技術演進,都對可持續的算力保障提出更迫切的需求。

例如,今年開年後,政務在AI上動作極快。深圳福田提出“數智員工”,首批上線70名“數智員工”,“AI招商助手”將企業篩選分析時間縮至分鐘級;福建漳州計劃陸續推出30個“AI公務員”,聚焦教育、醫療、應急、環保、文旅等領域;北京市監局通過百度智能雲千帆接

入DeepSeek,爲企業登記註冊提供全天候“諮詢”。

業內人士告訴數智前線,更多城市看到AI對北京、杭州等地的產業帶動後,在統籌政務系統建設中,將AI作爲抓手。未來兩三個月,不少城市的“一網通辦”,將提供更多AI服務

“在這一過程中,算力面臨挑戰雖然DeepSeek等模型,對訓練的算力要求降低了,但對推理的需求卻增加了,因爲滿血模型的參數量不小,而且深度推理的‘自言自語’過程,相較於只給出一個答案,會消耗更多token。”資深人士告訴數智前線,“尤其是過去算力建設以訓練爲主,今年將轉向推理爲主,政務領域算力將面臨一波升級。”

在教育領域,去年秋季以來,高校已成爲智算採購大戶。在AI for science領域,人工智能在提高科研的質量和產出,像上海交大與百度合作推進AI for science,在新材料發現等上有很大促進作用。

今年以來,不少高校快速接入DeepSeek,在嚐鮮後,又將學校裏的業務系統對接大模型,結果用戶量迅速攀升,併發越來越大。一些高校在教學的實操環節,甚至提出“要爲每一間教室分配一些算力”。同時,長尾需求也在暴增,一些雙非院校或職校,包括學校的院系甚至教研組,都提出算力需求。

除了大語言模型落地帶來的算力激增,今年各行業對多模態的需求,也在拉動算力基礎設施的建設

寧德時代持續引入多種人工智能技術,展開數智化建設,通過AI技術,保證產線的良率與效率。國家電網聯合百度等公司,推出千億級多模態行業大模型,深入電網安全、新能源消納及供電服務等核心場景。百度不久前推出的原生多模態大模型文心4.5,已迅速被引入各行業,它支撐的視頻捕捉與智能分析,正在幫助連鎖行業優化服務和食安管理。這都對算力提出大量多元化要求。

伴隨大模型的應用深入,智能體也呈現爆發勢頭。今年Manus讓大家看到了多智能體調用,個人和企業都展現出極大熱情。百度近日全量上線國內首個對話式應用開發平臺百度秒噠,上線24小時就吸引了超過2萬用戶體驗,創建應用數量突破3萬個,相當於每3秒就誕生1個應用。

一些業界人士預言,2025年不僅是智能體“元年”,或許也是智能體的爆發之年。智能體的普及,也正在推升算力需求。

但與激增的算力需求相比,當下國內AI算力供應緊缺。在中國市場,由於美國禁令,國外芯片的供應受到限制,並且由於全球人工智能需求旺盛,芯片交貨緩慢、價格上漲。美國還在不斷推出新政,進一步限制中國獲取先進芯片技術。在這種情況下,中國亟需可持續供應的自主AI算力

這也促使國產算力的腳步越走越快。在百度智能雲三萬卡集羣月底點亮之外,崑崙芯服務器近日中標招商銀行項目,將圍繞多個核心業務場景,全面支持招商銀行落地大模型應用。而這些多元化算力,將爲互聯網、金融、能源、工業、教育等衆多領域,加速智能化轉型,提供堅實的算力保障和支撐。

02

構建三萬卡集羣的攔路虎,如何擊破?

三萬卡集羣建設,從硬件到軟件,技術挑戰是全方位的。結合崑崙芯以及百舸4.0的創新技術,在集羣點亮過程中,解決了當下人工智能大規模集羣面臨的關鍵問題。

例如,包括DeepSeek在內的不少模型,採用了MoE(混合專家模型)架構,通過多專家並行和集羣互聯技術,降低了對高算力單卡的依賴,並在有限的算力和訓練Token資源下,開發能耗更低、推理和訓練效果更優的大模型。

根據介紹,崑崙芯P800基於新一代自研架構XPU-P,顯存規格比同類主流GPU高出20%-50%,這對MoE架構更加友好。同時,支持了8bit推理、MLA(多頭潛在注意力機制)、多專家並行等特性,這些特性實現更大的吞吐、更低時延,進一步降低集羣訓練及推理成本。

與此同時,百度百舸AI異構計算平臺4.0,在3萬卡集羣建設中,圍繞落地大模型全旅程的算力需求,發揮了至關重要的作用。

爲了解決大模型訓練時高通信帶寬的需求,百舸4.0已構建了超大規模HPN高性能網絡,將帶寬有效性提升到90%以上。

3萬卡集羣能耗極高,常規的散熱方案能耗可達十兆瓦或更高。爲此,百舸採用了創新性散熱方案,可以有效降低能耗,爲企業的模型訓練,進一步降低成本。

爲了提升GPU 的有效利用率(通常用MFU來表示GPU的有效利用率),百舸不斷優化並完善模型的分佈式訓練策略,將訓練主流開源模型的集羣MFU提升至58%。

大規模集羣執行訓練任務的穩定性非常關鍵。百舸可快速自動偵測到導致訓練任務異常的節點故障。同時,通過百度自研的BCCL(百度集合通信庫),能快速定位故障並自動化重新調度任務到健康節點,繼續完成訓練,目前已將故障恢復時間從小時級降低到分鐘級,保障集羣有效訓練率達到98%。

這些技術最終確保了崑崙芯集羣的“多、快、穩、省”。

在2025年兩會期間,人工智能成爲核心議題之一,政府工作報告明確提出“持續推進‘人工智能+’行動”,強調將數字技術與製造業實體經濟深度融合,支持大模型廣泛應用。這表明,以場景爲核心,落地產業,已成爲實現人工智能價值的關鍵路徑。

不過,業界認爲,大模型落地行業,還有很長的路要走。不少行業和企業在探索場景、治理數據,嘗試多元的算力支撐,探討AI落地價值,並進行人才儲備。

在這樣的形勢下,大模型業界及生態,也在從底層算力、模型、工具鏈和應用,逐步構建起可持續、全方位的方案。而此次百度即將點亮的三萬卡集羣,爲產業注入了強大動力,將進一步助推企業迎接新一輪科技和產業變革。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10