廣發證券:英偉達(NVDA.US)新平台加強Agent應用競爭力 AI推理驅動存儲周期持續向上

智通財經
9小時前

智通財經APP獲悉,廣發證券發布研報稱,英偉達(NVDA.US)在GTC展示Vera RubinPOD,此次重點加強針對Agent應用在集群化算力和推理算力產品線的競爭力。AI的進擊時刻,模型創新與CAPEX築基,AI產業鏈協同發展;AI推理驅動存儲周期持續向上,擴產與升級同發力。建議關注產業鏈核心受益標的。

廣發證券主要觀點如下:

英偉達發布Vera Rubin POD平台

根據英偉達官網,2026年3月16日,英偉達在GTC展示Vera RubinPOD,包括5個專為Agentic AI工作負載打造的全新機架級系統。由於Agentic工作負載對高吞吐量、極低延遲的推理、密集的CPU沙箱和龐大的上下文內存存儲提出更高要求,英偉達此次重點加強針對Agent應用在集群化算力和推理算力產品線的競爭力。Vera Rubin POD主要分為兩種機架:(1)MGXNVL機架:即VeraRubin NVL72,機架內部通過NVLink互連,承擔核心GPU計算任務;(2)MGXETL機架:包括Groq3 LPX機架、Vera CPU機架、BlueField-4 STX存儲機架和Spectrum-6 SPX網絡機架,這些機架均通過SpectrumX以太網或Groq3 LPU的芯片直接互連進行協同。按照官網示意圖測算,一個Vera Rubin 1152 SuperPOD由16個Vera Rubin NVL72機架、2個Vera CPU機架、10個Groq 3 LPX機架、2個BlueField-4 STX存儲機架以及10個Spectrum-6 SPX網絡機架組成,體現其圍繞Agentic AI所構建的異構協同系統架構。

Groq3 LPX機架用於加速decoding。

Groq3 LPX機架集成256個LPU處理器,配備128 GB片上SRAM和640TB/s的帶寬在Vera Rubin NVL72與LPX的組合架構中,GPU主要負責Prefill以及Decode階段中的Attention計算,LPU則負責加速Decode階段的FFN計算,對每層每個輸出token的解碼過程進行加速,並通過定製化Spectrum-X互連與Vera Rubin機架協同。根據英偉達官網披露,在每用戶400 TPS的條件下,Vera Rubin NVL72與LPX的組合相比NVIDIAGB200 NVL72,每兆瓦可實現高達35倍的TPS提升,在提升系統整體產出的同時,也更適配低時延、強交互的Agent應用場景。

Vera CPU機架承擔RL/Agent沙箱環境支撐

Vera CPU機架集成256個Vera CPU,採用高密度液冷設計,單個機架可支持超過22500個併發強化學習(RL)或代理沙箱環境,用於對Vera Rubin NVL72與LPX輸出結果進行測試、執行與驗證。

風險提示

AI產業發展以及需求不及預期;AI服務器出貨量不及預期,國產廠商技術和產品進展不及預期。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10