智通財經APP獲悉,廣發證券發布研報稱,英偉達(NVDA.US)在GTC展示Vera RubinPOD,此次重點加強針對Agent應用在集群化算力和推理算力產品線的競爭力。AI的進擊時刻,模型創新與CAPEX築基,AI產業鏈協同發展;AI推理驅動存儲周期持續向上,擴產與升級同發力。建議關注產業鏈核心受益標的。
廣發證券主要觀點如下:
英偉達發布Vera Rubin POD平台
根據英偉達官網,2026年3月16日,英偉達在GTC展示Vera RubinPOD,包括5個專為Agentic AI工作負載打造的全新機架級系統。由於Agentic工作負載對高吞吐量、極低延遲的推理、密集的CPU沙箱和龐大的上下文內存存儲提出更高要求,英偉達此次重點加強針對Agent應用在集群化算力和推理算力產品線的競爭力。Vera Rubin POD主要分為兩種機架:(1)MGXNVL機架:即VeraRubin NVL72,機架內部通過NVLink互連,承擔核心GPU計算任務;(2)MGXETL機架:包括Groq3 LPX機架、Vera CPU機架、BlueField-4 STX存儲機架和Spectrum-6 SPX網絡機架,這些機架均通過SpectrumX以太網或Groq3 LPU的芯片直接互連進行協同。按照官網示意圖測算,一個Vera Rubin 1152 SuperPOD由16個Vera Rubin NVL72機架、2個Vera CPU機架、10個Groq 3 LPX機架、2個BlueField-4 STX存儲機架以及10個Spectrum-6 SPX網絡機架組成,體現其圍繞Agentic AI所構建的異構協同系統架構。
Groq3 LPX機架用於加速decoding。
Groq3 LPX機架集成256個LPU處理器,配備128 GB片上SRAM和640TB/s的帶寬。在Vera Rubin NVL72與LPX的組合架構中,GPU主要負責Prefill以及Decode階段中的Attention計算,LPU則負責加速Decode階段的FFN計算,對每層每個輸出token的解碼過程進行加速,並通過定製化Spectrum-X互連與Vera Rubin機架協同。根據英偉達官網披露,在每用戶400 TPS的條件下,Vera Rubin NVL72與LPX的組合相比NVIDIAGB200 NVL72,每兆瓦可實現高達35倍的TPS提升,在提升系統整體產出的同時,也更適配低時延、強交互的Agent應用場景。
Vera CPU機架承擔RL/Agent沙箱環境支撐
Vera CPU機架集成256個Vera CPU,採用高密度液冷設計,單個機架可支持超過22500個併發強化學習(RL)或代理沙箱環境,用於對Vera Rubin NVL72與LPX輸出結果進行測試、執行與驗證。
風險提示
AI產業發展以及需求不及預期;AI服務器出貨量不及預期,國產廠商技術和產品進展不及預期。