摩爾線程「雲邊端「全棧發布：國產GPU一個更大的故事

摩爾線程不想只做中國英偉達。

文｜Stargazer

編｜劉俊宏

一家國產GPU公司的產品跨度能有多大？5月18日，摩爾線程的2026產品發布會現場，出現了一幅頗具反差的畫面。

舞台一側展示的是誇娥萬卡智算集群，另一側是自研「長江」SoC驅動的智能終端MTT AICUBE和MTT AIBOOK。軟件端，摩爾線程給的是從數字世界智能體「小麥」，到加速物理AI落地的首個全棧具身智能仿真平台MT Lambda，再到持續進化的MUSA生態。

從數據中心到客廳茶几，摩爾線程在同一場發布會上展示了截然不同產品矩陣。

顯然，這不是一般芯片公司會做的事。它釋放的信號很明確：摩爾線程不只想做「國產英偉達」，而是要做一個覆蓋雲邊端的全棧算力基礎設施提供商。「全功能GPU」加「統一架構」，是它押注的差異化路線。

從萬卡集群到家庭中樞

一套架構打穿

摩爾線程的產品矩陣看似跨度極大，實則共用同一套MUSA架構內核。這是「全功能GPU」路線首次在中國市場完成雲邊端的完整落地驗證。

先看雲端，這一次摩爾線程給出的是一套大模型訓練的硬件基座。

基於MTT S5000構建的誇娥萬卡智算集群已經商業化落地，幾個硬指標值得關注：Dense大模型訓練算力利用率（MFU）達到60%，MoE大模型達40%，訓練線性擴展效率95%，有效訓練時長佔比超過90%。這幾個數字合在一起的意思是——它不僅能跑起來，而且已經是能真實支撐行業應用的水平。

數據指標層面，MTT S5000單卡AI算力（稠密）為1000 TFLOPS，配備80GB顯存和1.6TB/s顯存帶寬，作為國內最早原生支持FP8精度的訓練GPU，在DeepSeek-V4、Qwen3.5、GLM-5.1等大模型上實現了「Day-0適配」。面向更大規模的智算需求，摩爾線程第五代「花港」架構已發布，支持十萬卡級擴展。更大的算力集群，才能應對不斷膨脹的大模型算力支出。

再看端側，本次發布會的最大新品亮點是MTT AICUBE。

摩爾線程對MTT AICUBE的定義很清晰：不是AI PC，不是NAS，而是「家庭AI中樞」。產品形態上，AICUBE整合了「小麥」全域智能體、50TOPS異構本地算力和全閃存私有云，標配1TB SSD，支持7×24小時運行。小麥智能體集成了90餘項CLI系統工具、60餘項技能和36款以上APP的跨應用控制，依託摩爾線程自研的MTClaw開源框架，高頻工具調用成功率超過95%。

摩爾線程AICUBE的戰略意圖，非常值得關注。

它搭載的「長江」SoC是摩爾線程自研芯片，集成8個2.65GHz全大核CPU、全功能GPU和高能效NPU，136GB/s內存帶寬，最高支持64GB LPDDR5X。這顆芯片同時支撐AI計算、圖形渲染和視頻編解碼——這正是「全功能GPU」理念在終端的延伸。摩爾線程把算力從智算中心推向家庭場景，本質上是在Token時代對端側算力需求的提前卡位。從某種角度來說，MTT AICUBE有點像是對標谷歌音響。兩者區別是谷歌能直連gemini，而MTT AICUBE對模型的支持更加開放。

最後是邊緣側AI產品，摩爾線程帶來了MTT E300 AI模組，它具有50TOPS異構算力、-20°C至+65°C寬溫設計，面向工業質檢、能源巡檢、具身智能、低空經濟等場景。從全球範圍來看，MTT E300 AI模組跟高通今年主推的躍龍系列有點像，都是主打工業領域的AI算力需求。

整體下來，E300與AIBOOK（AI算力本）、AICUBE共同構成「長江」SoC的落地三角，覆蓋個人、家庭到行業。

結合雲端萬卡集群的配置，展示出摩爾線程「雲邊端」三層不是割裂的產品線，而是MUSA統一架構在不同算力密度下的三種形態。

全功能GPU路線

摩爾線程在佈局什麼？

摩爾線程的真正差異化，不在於產品線全，而在於它選擇了一條國內罕有的「全功能GPU」技術路線。這個選擇背後，是摩爾線程對AI算力終局的一種判斷。

什麼是全功能GPU？簡言之，它不是只做AI加速，也不是圖形GPU（渲染），而是單一芯片同時支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的統一架構。換句話說，就是類似英偉達的GPU能力。其他大多數GPU廠商這邊，其產品還是有些專門設計，例如AMD的AI芯片和圖形芯片分屬兩套不同架構。

為什麼摩爾線程要選擇這條路線？因為，未來的AI不只是大模型訓練，而是數字世界與物理世界的深度融合。

具身智能行業的發展，已經證明了這一點。在機器人的訓練環節中，需要「算+渲+仿」三合一——AI計算訓練大腦、圖形渲染構建仿真環境、物理引擎模擬真實交互。這在傳統架構中，各環節是分開不同設備執行的，這就意味着開發者不得不在異構平台間反覆切換。而摩爾線程基於MUSA統一架構，用同一顆芯片就能完成全部任務，數據不再需要「傳來傳去」。

看到了這一機會，摩爾線程為具身智能專門推出了MT Lambda——國內首個全棧具身智能仿真平台，深度融合物理、渲染、AI三大引擎。今年3月，摩爾線程開源了MuJoCo Warp MUSA，為物理仿真平台MuJoCo提供了國產算力支持，在機器狗訓練任務中相較CPU方案實現最高40倍加速。與智源研究院合作，基於千卡S5000集群完成了RoboBrain 2.5具身大腦模型的端到端訓練，實測與國際主流GPU結果高度一致。與小馬智行、光輪智能、五一視界的合作也在密集落地。

摩爾線程在這個賽道的卡位，本質上是在賭一個判斷：物理AI時代，只有全功能GPU能同時支撐「思考」與「行動」兩種計算範式。

最後，依然是老生常談的國產GPU突破最重要的生態難題。在這一部分，摩爾線程也介紹了不少新的進展。

目前，MUSA SDK 5.1.0兼容CUDA 12.8，核心API兼容數達761，PyTorch全量3194個算子100%兼容。軟件工具層面，摩爾線程獲得了SGLang、vLLM、TileLang三大全球頂級推理框架的官方原生支持。這意味着國產GPU開始從「兼容可用」走向「被主流生態主動接納」。在開發者社區層面，目前摩爾線程也擁有45萬+的社區開發者和200+高校覆蓋，這些也能為長期生態建設提供了基礎。

但必須指出的是，生態建設沒有捷徑。從兼容CUDA到建立真正自主的MUSA原生生態，從跟隨到引領，這纔是真正的長征。

結語

國產GPU的競爭正在從「有沒有」，進入「能不能打」的第二階段。

根據IDC數據顯示，2025年中國AI加速卡總出貨量約400萬張，其中國產廠商交付約165萬張，國產份額達41%。這組數據已經證明，中國GPU不僅能用，而且已經開始承擔AI算力市場的重要角色。

在這一變局中，摩爾線程作為對標英偉達的玩家，正在用統一架構打通雲邊端，用全功能GPU卡位物理AI時代。至於統一架構能否支撐摩爾線程從「國產替代」真正走向「國際競爭」？接下來AICUBE的京東預售數據和誇娥集群的訂單增速，會在今年給出初步答案。

或許，摩爾線程的未來仍然是辛苦的。

根據公司財報顯示，摩爾線程2025年營收15.06億元、按年增長243%，2026年一季度營收7.38億元、按年增長155%——高增速背後，是摩爾線程從「賣芯片」向「賣算力基礎設施」的轉型加速。

但無論如何，摩爾線程已經證明了一件事：國產GPU不僅可以追隨，也可以嘗試定義一條屬於自己的技術路線。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

摩爾線程「雲邊端「全棧發布：國產GPU一個更大的故事

熱議股票