金吾財訊 | 中金公司發研報指,GTC 2026在美國加州召開。會議中,NVIDIA管理層明確指出,AI推理正進入算力拐點(Inference Inflection Point),由於模型尺寸、上下文長度及tokens生成的擴展,行業需求正從「訓練主導」向「推理驅動」的範式轉移。針對這一變化,公司的AI基礎設施規劃開始從單一芯片升級為「整櫃級」系統,還特別增加了為推理負載提供的,面向預填充與低延遲解碼的協同解決方案。我們認為這一變化對AI算力芯片行業及產業鏈發展影響深遠,其他廠商也有望推出更多專用化、解耦化、異構化的推理產品。