黃仁勳「述職報告」2026

文|硅基星芒

周一，黃仁勳穿着標誌性的皮衣開啓了英偉達2026年的GTC大會。

今年的GTC，和往年有所不同。儘管全世界都在期待更快的GPU，但黃仁勳帶來的不是產品發布會，而是一場關於AI時代工業革命的敘述。

英偉達全新的宏大敘事，定義了這場革命的生產資料、生產方式、經濟模型，以及驅動一切的硬件基石和操作系統。

短短兩個小時，黃仁勳清晰地描述了英偉達的未來和整個AI行業未來的藍圖。

01「AI工廠」的誕生和「推理拐點」的來臨

黃仁勳在這場演講中提出了兩個核心判斷，作為英偉達的戰略基礎：

①推理拐點：AI從學習走向工作。

過去的兩年中，AI的算力消耗主要集中在訓練階段，各大AI企業都在費盡心思研究如何設計出功能更強大的模型，規模化法則（Scaling Law）也正是在這個階段生效：模型越大、數據越多，性能就越好。

如今，行業已經結束這個階段，進入了推理階段的爆發期，OpenClaw等產品的爆發讓AI模型被大規模地實際應用。

按照黃仁勳的說法，推理所需的計算量可能達到訓練所需的數萬倍甚至數十萬倍。

無論是ChatGPT、Gemini還是DeepSeek、豆包，每一次日常交流、每一次代碼生成都是一次複雜的推理。

因此，即使前沿大模型推陳出新的周期開始放緩，GPU需求仍然在持續暴漲。

而OpenClaw作為一款有極大安全風險的開源產品在全世界爆火，更是說明我們現在看到的增長，必然只是冰山一角。

②AI工廠經濟學：定義新世界KPI

推理的拐點到來之際，黃仁勳也給出了數據中心的新經濟模型：

Token將會成為新產品，數據中心不再是用於存儲數據的成本中心，而是生產智能的利潤中心，也就是所謂的「AI工廠」。

算力會成為新的貨幣，與token正向關聯。

而新的KPI指標，則是每瓦特電力能夠產生的token數量。

在美國，電力仍然是所有數據中心的最終物理瓶頸。最大化每瓦電力的token產出就等同於最大化收入。

通俗而準確的解釋，不僅使AI行業抽象的專業詞彙更加具象化，還將從CEO到開發者的思維都牢牢吸引到了英偉達最具優勢的賽道上。

在這套新的經濟範式下，英偉達的野心已經顯露：它掌握着大量的貨幣，不願意只給淘金的人賣鏟子，而是要打造整套「工廠藍圖」和「生產線」。

02「AI工廠」的核動力：硬件基石

英偉達最大的優勢就是算力，除了Google靠着自研TPU硬是打出了一片天地，世界上絕大部分企業仍然受制於英偉達的GPU供給。

推理需求的爆發，就意味着「AI工廠」需要消耗前所未有的能源。

值此之際，英偉達推出了宣傳已久的Vera Rubin。

相比以前GTC展示的單塊GPU，Vera Rubin是一台機架級的超級計算機。

本質上，它是一個極致垂直整合的產物，集成了新一代GPU、專為AI代理任務設計的CPU、新一代網絡、新一代存儲等七顆關鍵芯片，並結合液冷技術和精密協同設計，共同封裝在一個機架之中。

自此，英偉達的交付單位，已經從芯片躍升到即插即用的計算系統。

除此之外，這次GTC大會還有另一項技術驚喜，也就是Groq LPU技術整合。

英偉達已經注意到現階段的AI計算需求開始呈現極端化的趨勢：

一是高吞吐量，Vera Rubin擅長進行海量並行計算，適合處理批量任務；

二是超低延遲，Groq LPU有極快的單次響應速度，這是交互式應用的關鍵。

英偉達的解法，是在軟件層面上將所需的兩種能力「分而治之」，高強度的數學運算放在Vera Rubin上，對延遲極度敏感的token生成環節則交給Groq，這一解決方案將高價值交互應用的性能足足提升了35倍。

AI工廠的產出，遠不止數字世界的token。

在黃仁勳看來，具身智能（Embodied AI）這個更廣闊的物理世界大有可為。

但僅憑現實世界中的數據，想訓練機器人應對所有突發的陌生情況，恐怕永遠都不夠。

解決方案就藏在他提出的新經濟模型中：算力就是貨幣，貨幣就能帶來數據。

通過仿真平台生成海量高質量的合成數據，在虛擬世界中訓練AI，再部署到現實世界中的機器人中。這套Sim-to-Real的路徑，或許就是解決機器人智能化的關鍵。

當然，盲目的技術樂觀主義不可取，目前的AI模型基礎能力尚不足以支撐具身智能商業化落地。

不過，無論是通用的機器人基礎模型GR00T，還是具備思考和推理能力的自動駕駛模型Alpamayo，都證明了英偉達正在將「AI工廠」提供的生產力投入到了價值50萬億美元的製造業和汽車業。

03「AI工廠」的大腦：Dynamo 1.0

強大的「核反應堆」Vera Rubin已經誕生，接下來的問題就是如何讓它像小龍蝦一樣7×24小時高效運轉。

這個問題的答案，同樣藏在軟件層面。英偉達在GTC大會同期發布的Dynamo 1.0技術博客，正式將驅動「AI工廠」的大腦公開於衆。

Dynamo是一個專門為大規模、多節點、企業級AI推理而設計的軟件框架。如果Vera Rubin是token的硬件生產線，那Dynamo就是生產線的控制器。它雖然不直接生產token，但卻保證了生產流程的效率、速度和穩定性。

具體來說，Dynamo在以下四個方面實現了不同程度的技術突破：

1.在Vera Rubin平台上，Dynamo可以通過解耦服務等技術將模型的推理請求處理能力提升約7倍，直接提升了核心的「KPI指標」；

2.AI從Chatbot進化到Agent後，智能體的工作流運作需要經過多輪對話、後台思考、調用工具等複雜流程。而Dynamo具備「智能體感知」能力，能夠通過智能體提示（Agent Hints）理解任務的優先級，優先處理關鍵任務，將智能體應用的首次響應時間降低4倍；

3.現代AI應用普遍需要頻繁啓動新模型實例，但傳統方式下加載、編譯和優化模型耗時費力。Dynamo的ModelExpress技術通過檢查點恢復和模型權重流式傳輸等方法，將新實例的啓動時間加快7倍，「AI工廠」的生產將會更加靈活；

4.部署大模型對大部分人來說門檻仍然太高，Dynamo的DGDR功能允許開發者只提供模型、硬件和流量等目標，系統即可自動完成性能分析、配置和部署。

Dynamo的推出，完美印證了英偉達的領先已經不再侷限於硬件層面，還有深不可測的軟件和系統工程能力。

04英偉達的生態戰略

綜上所述，英偉達通過GPU構建起來的護城河，如今已經延伸到了生態戰略。

在演講中，黃仁勳將OpenClaw這個開源智能體框架比作AI時代的Linux，並判斷它會成為下一代的操作系統，且必將開啓一個全新的「智能體即服務」的時代。

此前的文章中我們曾提到過一個名為NemoClaw的平台產品，如今已經正式發布。英偉達的目標只有一個：讓自己成為這場技術革命的標準制定者和安全守護者，讓所有企業都能放心加入這場養蝦浪潮。

同樣的策略也放在了智能體底層的基礎模型上。通過成立Nemotron聯盟，英偉達聯合了Mistral、Perplexity等知名AI公司，試圖共同打造下一代基礎模型。如此一來，AI生態的軟件將與英偉達的硬件實現更深層的綁定。

這也正是黃仁勳的高明之處：

從芯片（Rubin）、系統（機架）、網絡（NVLink）、軟件（Dynamo）、操作系統（NemoClaw）到AI模型（Nemotron），英偉達在每一個環節都實現了深度自研和極致協同設計。

這種垂直整合的模式帶來的，是競爭對手難以比擬的性能和效率。

與此同時，英偉達也並未試圖獨吞市場。

與各大雲廠商和AI初創公司合作，表面上是「賦能所有人」，「給雲廠商帶來客戶」，實則是將自己的技術棧嵌入全球的計算平台，使整個生態系統都建立在英偉達的底層技術之上。

未來如果回顧2026年的GTC，或許它就是一個時代的轉折點。

英偉達構建了一個以token為商品、以算力為貨幣、以「AI工廠」為核心生產單位的全新經濟循環。

在這個循環中，英偉達有最高效的生產工具、最智能的生產管理系統，甚至定義了生產標準。

它不再是一家GPU供應商，而是AI基礎設施與經濟體構建者。

未來的「卡脖子」，只會更緊。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

黃仁勳「述職報告」2026

熱議股票