RV生態又一里程碑:英偉達官宣CUDA將兼容RISC-V架構!

電子發燒友
07-19

電子發燒友網報道(文/梁浩斌)英偉達生態護城河CUDA,從最初支持x86、PowerCPU架構,到2019年宣佈支持ArmCPU,不斷拓展在數據中心的應用生態。在2019年至今的六年時間裏,RISC-V生態也在不斷壯大,RISC-VCPU產品性能持續提高,開始往高性能的服務器CPU發展,形成向Arm服務器CPU挑戰的趨勢。

而在最近的第五屆RISC-V中國峯會上,英偉達副總裁FransSijstermanns宣佈了一則重磅消息:英偉達要將CUDA移植到RISC-V架構上。

英偉達每年出貨超10億顆RISC-VMCU

FransSijstermanns在峯會演講中指出,英偉達是RISC-V國際基金會(RVI)和RISC-V軟件生態系統聯盟(RISE)的董事會成員和技術委員會代表,並且是RISC-V規範的定期貢獻者。

實際上,英偉達使用RISC-V架構設計MCU已經有10年時間。去年10月,英偉達披露了他們在RISC-V領域的歷史,早在2015年,英偉達就確立了RISC-V作爲其GPU控制器的CPU架構。

根據去年英偉達公開的信息,目前英偉達已經推出了至少三類RISC-V的MCU核心,包括NV-RISCV32(RV32I-MU指令集,順序單發射核心)、NV-RISCV64(RV64I-MSU指令集,亂序雙發射核心)、NV-RVV(NV-RISCV32增加向量運算能力)。

本次峯會上公開的資料顯示,英偉達RISC-V架構被集成到30多個IP中,每年出貨超過10億顆RISC-VMCU。

CUDA移植到RISC-V有哪些難題?

FransSijstermanns表示,CUDA是C語言和C++語言的拓展,是爲了讓GPU運行速度更快、更高效。現在CUDA只在x86和ArmCPU上得以部署,但英偉達也正在向外界傳達一個信息——要將CUDA也移植到RISC-V架構上,“我相信這個未來是大有可爲的”。

據介紹,CUDA的移植主要包含兩個部分,Toolkit工具箱和驅動程序。首先是CUDA編譯器和工具,比如NVCC、GDB、工具鏈等,這部分用於構建開發GPU加速應用程序的環境。另外還有CUDA庫,NVIDIANsight,以及驅動程序CUDAKMD和CUDAUMD。

在CUDA加速應用中,所有軟件都需要映射到目標CPU,包括應用特定的模塊、CUDA庫代碼、第三方軟件等,這些都需要重新移植到RISC-V處理器上,以支撐在RISC-V處理器上構建和部署應用程序。

其中,CUDA庫是非常重要的,在不同行業中都可能需要有專門的庫。比如物理模擬、計算光刻、量子計算、基因測序、數據處理、天氣分析等,不同行業和垂類都有相應的庫。通過CUDA庫中,針對英偉達GPU進行深度優化的一系列函數集合,可以直接加速對應的計算任務,對於開發者來說,使用CUDA庫可以簡化開發流程,無需重頭編寫底層GPU代碼,只需要調用CUDA庫的API就可以實現並行計算。

據介紹,英偉達通過20多年的積累,已經建立了900多個不同的庫,爲多個行業的技術發展帶來極大加速。那麼未來在CUDA成功移植到RISC-V後,就能夠使用RISC-VCPU+英偉達GPU來運行這些庫,爲多種行業計算加速。

不過,FransSijstermanns也提到,英偉達在將CUDA移植到RISC-VCPU的過程中,也遇到了問題。

首先,RISC-VCPU的板卡可用的選擇非常有限,目前英偉達主要基於SiFiveP550和阿里巴巴玄鐵C920進行開發,性能還難以符合服務器需求;同時最新的RVA23配置文件和服務器SoC雖然已經獲得批准,但目前還未有符合RVA32標準的高性能CPU板卡產品推出,現有產品在單核性能上也較弱。

RVA23是RVI在2024年10月批准的RVA配置文件規範,其中新增的關鍵強制性組件包括向量擴展和虛擬機管理程序擴展,解決了RISC-VCPU進行AI運算、操作系統和軟件工作負載等問題,有助於加速RISC-V軟件生態在工具鏈和操作系統中的廣泛實施。

其次,對於RISC-VCPU,可能需要統一虛擬內存來加速CPU和GPU內存之間的數據交換速度,以保證體驗一致性。

當然,在軟件方面,也還需要進一步的優化,需要更高層次的應用堆棧,才能實現CUDA在RISC-V上的成熟運行。

目前英偉達也正在與RISC-V相關合作伙伴進行合作,着手CUDA的移植工作,未來一旦生態系統成熟,標準的CUDA版本將可以支持符合服務器平臺規範和運行Linux操作系統的RISC-V架構CPU。

RISC-V架構迎來里程碑?

不久前Arm放出豪言,預計到2025年年底,Arm在全球數據中心CPU的份額將會飆升至50%,而去年Arm的份額僅爲15%。而回顧Arm在服務器CPU市場的發展,2019年可以稱得上是一個拐點。

自2019年英偉達宣佈CUDA支持Arm架構CPU後,持續擴大對Arm生態的支持,在2023年宣佈將CUDA全面擴展至Arm生態,爲Arm基礎設施提供完整的AI和HPC軟件堆棧,包括加速600多個HPC應用程序和所有AI框架。

Arm在服務器CPU市場的份額,也從2019年幾乎忽略不計,到2020年快速提升至接近3%;到2024年市場份額更是躍升至15%。當然,Arm市場份額的飆升也得益於頭部雲計算服務商爲了降低成本,集體轉向自研芯片的路線,變相推動了Arm生態在數據中心的應用。

那麼對於目前的RISC-V架構而言,其相比Arm的主要優勢在於,開放的指令集架構可以支持更多的定製化設計,廠商能夠更容易針對特定場景實現差異化的競爭力;授權費用更低,根據中國開放指令生態(RISC-V)聯盟祕書長包雲崗的分享,以一款量產10萬顆的64核服務器CPU爲例,開發成本約7.5億元人民幣,如果使用基於開源的聯合開發模式,比如RISC-V,可以降低2.5億元,也就是33%的研發費用。

業界普遍擔憂的是,RISC-V的開放特性可能會導致架構的碎片化。但CUDA對RISC-V的統一支持,未來能夠降低兼容門檻,有可能在部分細分市場復現Arm的成功路徑。

不過更重要的是,英偉達的加入,將爲RISC-V產業注入新的信心,吸引更多玩家入局,從而加速高性能RISC-V服務器芯片的落地。

FransSijstermanns在最後也再次確定英偉達的立場:“其實我們不在乎CPU具體是什麼,無論是x86、Arm或者是RISC-V,我們都能夠兼容。但是我們看中的一點是,就是要讓用戶和開發者有自己的選擇。CUDA能夠很好的幫助我們去跟RISC-V服務器藉助英偉達GPU實現加速,並且更好地提出相關的全套硬件解決方案,這也是我們從軟件過渡到硬件的願景。”

言下之意,當下RISC-V要在服務器領域有所建樹,還需要有足夠強大的RISC-VCPU去支撐用戶的需求。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10