快科技8月3日消息,國產GPU近年來不斷取得突破,前不久礪算科技的7G01芯片性能達到了RTX 4060級別,更早之前摩爾線程也推出過高性能GPU,不僅在遊戲方面可圈可點,AI也是一大重點。
在AI領域當前最強的GPU是NVIDIA推出的,硬件架構及CUDA生態構築了幾乎難以逾越的壁壘,那國產GPU在這方面到底差距多大?這事引發了很多爭議,知乎用戶@菽陌松囿作爲業內人員,有過實際測試,公佈了一些數據值得參考。
根據他的說法,(摩爾線程的GPU)kernel launch做到5us,nv大概是幾十us(有點忘記了),gemm mfu做到98%,nv大概85%,FA mfu做到95%,nv是68%。
此外,他還提到了N卡的一些不足,比如通信offload ace,nv根本就沒考慮,是DeepSeek幫他們做的sm隔離,15%的sm是浪費的。
當然,摩爾線程的GPU也不是沒有問題,比如支持Link但帶寬受限於硬件還有些差距,但這不是障礙。
他強調這些數據是經過研發同事確認的,不會糊弄同仁,意味着這些數據結果相當靠譜,反正這番對比下來還是有些讓人驚喜的,也頗爲意外。
總體來說,他認爲摩爾線程的GPU從硬件、kmd、umd算子庫全部都是重寫的,反擊了那些認爲摩爾線程沒有東西的人的說法。
他援引的數據詳細信息可以參考摩爾線程官號公佈的文章,裏面有更全面的技術解析,只不過是沒有nv數據對比的,菽陌松囿提供的數據對比可以觀察下兩者在AI上的表現,雖然這並不是說國產的GPU可以全面超越N卡,但也不是部分網友認爲的只是使用了國外IP套殼的說法。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。