本文由半導體產業縱橫(ID:ICVIEWS)編譯自semiwiki
RISC-V在DPU領域的崛起,爲重塑行業競爭格局創造了難得契機。
數據中心通常被認爲是CPU和 GPU之間的較量。但在這些備受矚目的競爭背後,另一場靜悄悄的革命正在上演:ARM 悄然取代了英特爾和 AMD 在數據處理單元 (DPU) 市場的份額。
DPU(也稱爲 SmartNIC)負責數據中心的“管道”。它們通過管理數據包處理、TCP/IP 和 RDMA 來減輕網絡負載。它們處理壓縮、加密和 NVMe-over-Fabrics (NVMe-oF) 等存儲服務。它們強制執行安全隔離,這在多租戶雲環境中至關重要,因爲信任邊界會不斷受到考驗。此外,它們還負責執行編排任務,否則這些任務會浪費寶貴的 CPU 週期。
NVIDIA、Marvell、AMD和 Broadcom 均在其 DPU 中採用了 ARM 內核。原因很簡單:ARM 內核體積小、功耗低、可授權,並且已經嵌入到網絡芯片中。當英特爾推出其基礎設施處理單元 $(IPU)$ 計劃時,ARM 已經佔領了整個生態系統並制定了標準。
爲什麼是現在?
全球數據處理單元(DPU) 市場預計將從 2023 年的 15 億美元增長到 2032 年的約 98 億美元,複合年增長率 $(CAGR)$ 高達 22.8%。Dataintelo 將這一增長歸因於數據生成的迅猛增長以及各行各業對高效數據管理和處理解決方案的需求。目前,ARM 內核佔據了 DPU 出貨量的絕大部分,而英特爾仍在持續推廣其 IPU,但尚未獲得廣泛的市場吸引力。
與此同時,RISC-V 在鄰近領域已勢頭強勁。來自首爾的Fadu等公司的存儲控制器(該公司將 RISC-V 內核集成到其企業級 SSD 控制器中,用於 I/O 調度和延遲優化)以及SiFive都使用 RISC-V 來加速 I/O。編排和安全處理器也經常依賴於輕量級 RISC-V 設計,例如OpenTitan。這些與 DPU 的角色天然相關。同時,地緣政治因素也有利於多元化:尤其是中國正在加速自主採用 RISC-V,而 DPU 正是那種主權至關重要的基礎設施組件。
市場擴張、ARM 的鎖定以及超大規模者對架構替代方案的渴望爲 RISC-V 進入 DPU 奠定了基礎。
RISC-V 在 DPU 中的機會
與ARM 不同,RISC-V 提供開放式 ISA,企業可以根據其具體工作負載進行定製。這對於集成了各種功能模塊的 DPU 尤其重要。用於數據包流的網絡引擎、用於壓縮和NVMe-oF 的存儲加速器、用於隔離的安全模塊以及用於編排的控制平面 CPU。RISC-V 允許供應商使用自定義指令來適應這些角色,而無需依賴 ARM 的固定路線圖。
如今的DPU通常使用ARM Cortex-A內核集羣(範圍從Cortex-A53到A72)來處理控制平面和輕量級計算功能。一些 RISC-V 供應商(例如 Akeana)支持每核最多四線程的同步多線程 (SMT)(Electronics360,2024),從而提高了高內存或 I/O 延遲工作負載(例如網絡和數據包處理)的吞吐量和利用率。最新的 RISC-V 矢量擴展可以自然地映射到數據包處理、加密和存儲加速。
新興的矩陣擴展將可編程性擴展到AI 推理和安全領域。初創公司 Simplex Micro 的架構在一個時間調度框架內集成了標量、矢量和矩陣執行,利用 RISC-V 的可擴展性,在各種 AI 和 HPC 工作負載中提供確定性的性能。最後,RISC-V 避免了 ARM 的專利費,同時保持了與 Linux、TensorFlow 和 PyTorch 等開源堆棧的兼容性。
瞭解RISC-V 的標量到矩陣路線圖
這一刻之所以引人注目,不僅僅是因爲又一家IP 供應商的宣傳,更在於 RISC-V 本身的發展方式。
該ISA 最初致力於標量計算——爲微控制器、嵌入式系統和支持 Linux 的簡單處理器提供小型、高效的內核。在過去幾年中,RISC-V 穩步增加了矢量擴展,實現了數據並行加速,並自然地映射到網絡、存儲和加密工作負載上。最近,其路線圖已擴展到包含矩陣擴展,旨在將 AI 推理和其他矩陣數學密集型任務納入同一 ISA 框架。
這種從標量到矢量再到矩陣的演進,反映了DPU的性能要求。DPU必須處理標量控制平面邏輯、可矢量化的數據包和加密流,以及日益面向矩陣的遙測和安全推理任務。換句話說,RISC-V路線圖爲真正可編程的DPU提供了完整的要素集。
目前,已有多家公司正在努力實現這一願景。Akeana憑藉其支持SMT 的設計和 AI 矩陣計算引擎,成爲率先將 RISC-V 直接應用於數據中心級計算的公司之一。Ventana Micro Systems正在構建服務器級RISC-V 處理器,該處理器擁有從標量到矢量工作負載的清晰路徑,以滿足超大規模計算的需求。歐洲的SemiDynamics專注於爲數據密集型和以AI 爲中心的應用量身定製的可配置矢量核心。
SiFive重點推出了支持Linux 和矢量的 RISC-V 內核,旨在滿足 HPC 和基礎設施的需求。晶心科技已擴展其內核,使其具備矢量和DSP功能,以實現嵌入式加速。Simplex Micro 正在開發一種統一的標量/矢量/矩陣架構,並配備可編程擴展功能,旨在覆蓋從邊緣到數據中心級的基礎設施解決方案。在研究層面,中國的“香山”已在同一個架構下進行標量和矢量統一的實驗。
跨越式發展還是強化ARM?
問題不僅僅在於RISC-V 能否取代 ARM,還在於它能否擴展 DPU 的定義本身。ARM 目前在 DPU 領域的主導地位依賴於標量核心加上固定加速器。RISC-V 通過將標量、矢量和矩陣可編程性融合到一個平臺中,提供了一條跨越式發展的途徑。這不一定以犧牲 ARM 爲代價——事實上,ARM 甚至可以採用 RISC-V 矢量和矩陣擴展來鞏固其自身的 DPU 地位。
對於更廣泛的行業而言,RISC-V 在 DPU 領域的崛起提供了一個難得的機會來重塑競爭格局。企業不再受ARM 許可模式的限制,而是可以根據自身需求調整架構。這對於希望優化功耗、性能和自主權的超大規模計算企業來說尤其重要。RISC-V 還避免了壟斷局面:與其由單一供應商主導路線圖,不如建立一個開放的生態系統,從而培育多條發展路徑。
藉助RISC-V,像高通或任何主要供應商這樣的公司都將佔據主導地位——能夠設計針對其 DPU 架構優化的獨特定製 CPU,而無需依賴 ARM 的許可條款和路線圖。隨着 DPU 成爲數據中心基礎設施的核心,這種獨立性可能成爲關鍵的差異化因素。
時機已到。AI 驅動的數據中心架構正在蓬勃發展,DPU 不再僅僅用於網絡,而是用於協調計算、存儲和 AI 流程。在這個世界中,結合標量、矢量和矩陣可編程性的 DPU 看起來比僅集成標量 ARM 內核和固定功能引擎的 DPU 更具吸引力。
正如ARM 發現並利用 DPU 的機會超越英特爾和 AMD 一樣,RISC-V 現在提供了重新定義這一類別的機會。供應商無需在GPU 領域與 NVIDIA 正面交鋒,也無需試圖重振 CPU,而是可以藉助可編程的 DPU 平臺實現跨越式發展,該平臺可以重塑數據中心基礎設施。這將是一個東山再起的故事——不是重複舊的戰鬥,而是開闢新的戰線。
無論它能否取代ARM 或 x86,業界常常將RISC-V 描述爲 CPU 領域的一個故事。然而,更具顛覆性的機會可能在於數據中心的控制平面。ARM 打造了英特爾和 AMD 從未預料到的 DPU 專營權,而現在 RISC-V 有機會憑藉矢量和矩陣可編程性重新定義這一類別。
最終,ARM 和 RISC-V 可能會在 DPU 領域共存:ARM 保持其主導地位,而 RISC-V 則提供開放、可定製的替代方案。隨着市場的成熟,這將爲供應商和超大規模計算提供商提供更多架構選擇。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅爲分享與討論,不代表我方贊成或認同,如有異議,請聯繫後臺。