快科技8月3日消息,國產GPU近年來不斷取得突破,前不久礪算科技的7G01芯片性能達到了RTX 4060級別,更早之前摩爾線程也推出過高性能GPU,不僅在遊戲方面可圈可點,AI也是一大重點。
在AI領域當前最強的GPU是NVIDIA推出的,硬件架構及CUDA生態構築了幾乎難以逾越的壁壘,那國產GPU在這方面到底差距多大?這事引發了很多爭議,知乎用戶@菽陌松囿作為業內人員,有過實際測試,公布了一些數據值得參考。

根據他的說法,(摩爾線程的GPU)kernel launch做到5us,nv大概是幾十us(有點忘記了),gemm mfu做到98%,nv大概85%,FA mfu做到95%,nv是68%。
此外,他還提到了N卡的一些不足,比如通信offload ace,nv根本就沒考慮,是DeepSeek幫他們做的sm隔離,15%的sm是浪費的。
當然,摩爾線程的GPU也不是沒有問題,比如支持Link但帶寬受限於硬件還有些差距,但這不是障礙。
他強調這些數據是經過研發同事確認的,不會糊弄同仁,意味着這些數據結果相當靠譜,反正這番對比下來還是有些讓人驚喜的,也頗為意外。
總體來說,他認為摩爾線程的GPU從硬件、kmd、umd算子庫全部都是重寫的,反擊了那些認為摩爾線程沒有東西的人的說法。
他援引的數據詳細信息可以參考摩爾線程官號公布的文章,裏面有更全面的技術解析,只不過是沒有nv數據對比的,菽陌松囿提供的數據對比可以觀察下兩者在AI上的表現,雖然這並不是說國產的GPU可以全面超越N卡,但也不是部分網友認為的只是使用了國外IP套殼的說法。
