
摩爾線程不想只做中國英偉達。
文|Stargazer
編|劉俊宏
一家國產GPU公司的產品跨度能有多大?5月18日,摩爾線程的2026產品發布會現場,出現了一幅頗具反差的畫面。
舞台一側展示的是誇娥萬卡智算集群,另一側是自研「長江」SoC驅動的智能終端MTT AICUBE和MTT AIBOOK。軟件端,摩爾線程給的是從數字世界智能體「小麥」,到加速物理AI落地的首個全棧具身智能仿真平台MT Lambda,再到持續進化的MUSA生態。
從數據中心到客廳茶几,摩爾線程在同一場發布會上展示了截然不同產品矩陣。
顯然,這不是一般芯片公司會做的事。它釋放的信號很明確:摩爾線程不只想做「國產英偉達」,而是要做一個覆蓋雲邊端的全棧算力基礎設施提供商。「全功能GPU」加「統一架構」,是它押注的差異化路線。
從萬卡集群到家庭中樞
一套架構打穿
摩爾線程的產品矩陣看似跨度極大,實則共用同一套MUSA架構內核。這是「全功能GPU」路線首次在中國市場完成雲邊端的完整落地驗證。
先看雲端,這一次摩爾線程給出的是一套大模型訓練的硬件基座。
基於MTT S5000構建的誇娥萬卡智算集群已經商業化落地,幾個硬指標值得關注:Dense大模型訓練算力利用率(MFU)達到60%,MoE大模型達40%,訓練線性擴展效率95%,有效訓練時長佔比超過90%。這幾個數字合在一起的意思是——它不僅能跑起來,而且已經是能真實支撐行業應用的水平。
數據指標層面,MTT S5000單卡AI算力(稠密)為1000 TFLOPS,配備80GB顯存和1.6TB/s顯存帶寬,作為國內最早原生支持FP8精度的訓練GPU,在DeepSeek-V4、Qwen3.5、GLM-5.1等大模型上實現了「Day-0適配」。面向更大規模的智算需求,摩爾線程第五代「花港」架構已發布,支持十萬卡級擴展。更大的算力集群,才能應對不斷膨脹的大模型算力支出。
再看端側,本次發布會的最大新品亮點是MTT AICUBE。

摩爾線程對MTT AICUBE的定義很清晰:不是AI PC,不是NAS,而是「家庭AI中樞」。產品形態上,AICUBE整合了「小麥」全域智能體、50TOPS異構本地算力和全閃存私有云,標配1TB SSD,支持7×24小時運行。小麥智能體集成了90餘項CLI系統工具、60餘項技能和36款以上APP的跨應用控制,依託摩爾線程自研的MTClaw開源框架,高頻工具調用成功率超過95%。
摩爾線程AICUBE的戰略意圖,非常值得關注。
它搭載的「長江」SoC是摩爾線程自研芯片,集成8個2.65GHz全大核CPU、全功能GPU和高能效NPU,136GB/s內存帶寬,最高支持64GB LPDDR5X。這顆芯片同時支撐AI計算、圖形渲染和視頻編解碼——這正是「全功能GPU」理念在終端的延伸。摩爾線程把算力從智算中心推向家庭場景,本質上是在Token時代對端側算力需求的提前卡位。從某種角度來說,MTT AICUBE有點像是對標谷歌音響。兩者區別是谷歌能直連gemini,而MTT AICUBE對模型的支持更加開放。
最後是邊緣側AI產品,摩爾線程帶來了MTT E300 AI模組,它具有50TOPS異構算力、-20°C至+65°C寬溫設計,面向工業質檢、能源巡檢、具身智能、低空經濟等場景。從全球範圍來看,MTT E300 AI模組跟高通今年主推的躍龍系列有點像,都是主打工業領域的AI算力需求。
整體下來,E300與AIBOOK(AI算力本)、AICUBE共同構成「長江」SoC的落地三角,覆蓋個人、家庭到行業。
結合雲端萬卡集群的配置,展示出摩爾線程「雲邊端」三層不是割裂的產品線,而是MUSA統一架構在不同算力密度下的三種形態。
全功能GPU路線
摩爾線程在佈局什麼?
摩爾線程的真正差異化,不在於產品線全,而在於它選擇了一條國內罕有的「全功能GPU」技術路線。這個選擇背後,是摩爾線程對AI算力終局的一種判斷。
什麼是全功能GPU?簡言之,它不是只做AI加速,也不是圖形GPU(渲染),而是單一芯片同時支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的統一架構。換句話說,就是類似英偉達的GPU能力。其他大多數GPU廠商這邊,其產品還是有些專門設計,例如AMD的AI芯片和圖形芯片分屬兩套不同架構。
為什麼摩爾線程要選擇這條路線?因為,未來的AI不只是大模型訓練,而是數字世界與物理世界的深度融合。
具身智能行業的發展,已經證明了這一點。在機器人的訓練環節中,需要「算+渲+仿」三合一——AI計算訓練大腦、圖形渲染構建仿真環境、物理引擎模擬真實交互。這在傳統架構中,各環節是分開不同設備執行的,這就意味着開發者不得不在異構平台間反覆切換。而摩爾線程基於MUSA統一架構,用同一顆芯片就能完成全部任務,數據不再需要「傳來傳去」。
看到了這一機會,摩爾線程為具身智能專門推出了MT Lambda——國內首個全棧具身智能仿真平台,深度融合物理、渲染、AI三大引擎。今年3月,摩爾線程開源了MuJoCo Warp MUSA,為物理仿真平台MuJoCo提供了國產算力支持,在機器狗訓練任務中相較CPU方案實現最高40倍加速。與智源研究院合作,基於千卡S5000集群完成了RoboBrain 2.5具身大腦模型的端到端訓練,實測與國際主流GPU結果高度一致。與小馬智行、光輪智能、五一視界的合作也在密集落地。

摩爾線程在這個賽道的卡位,本質上是在賭一個判斷:物理AI時代,只有全功能GPU能同時支撐「思考」與「行動」兩種計算範式。
最後,依然是老生常談的國產GPU突破最重要的生態難題。在這一部分,摩爾線程也介紹了不少新的進展。
目前,MUSA SDK 5.1.0兼容CUDA 12.8,核心API兼容數達761,PyTorch全量3194個算子100%兼容。軟件工具層面,摩爾線程獲得了SGLang、vLLM、TileLang三大全球頂級推理框架的官方原生支持。這意味着國產GPU開始從「兼容可用」走向「被主流生態主動接納」。在開發者社區層面,目前摩爾線程也擁有45萬+的社區開發者和200+高校覆蓋,這些也能為長期生態建設提供了基礎。

但必須指出的是,生態建設沒有捷徑。從兼容CUDA到建立真正自主的MUSA原生生態,從跟隨到引領,這纔是真正的長征。
結語
國產GPU的競爭正在從「有沒有」,進入「能不能打」的第二階段。
根據IDC數據顯示,2025年中國AI加速卡總出貨量約400萬張,其中國產廠商交付約165萬張,國產份額達41%。這組數據已經證明,中國GPU不僅能用,而且已經開始承擔AI算力市場的重要角色。
在這一變局中,摩爾線程作為對標英偉達的玩家,正在用統一架構打通雲邊端,用全功能GPU卡位物理AI時代。至於統一架構能否支撐摩爾線程從「國產替代」真正走向「國際競爭」?接下來AICUBE的京東預售數據和誇娥集群的訂單增速,會在今年給出初步答案。
或許,摩爾線程的未來仍然是辛苦的。
根據公司財報顯示,摩爾線程2025年營收15.06億元、按年增長243%,2026年一季度營收7.38億元、按年增長155%——高增速背後,是摩爾線程從「賣芯片」向「賣算力基礎設施」的轉型加速。
但無論如何,摩爾線程已經證明了一件事:國產GPU不僅可以追隨,也可以嘗試定義一條屬於自己的技術路線。