黃仁勳「述職報告」2026

藍鯨財經
昨天

文|硅基星芒

周一,黃仁勳穿着標誌性的皮衣開啓了英偉達2026年的GTC大會。

今年的GTC,和往年有所不同。儘管全世界都在期待更快的GPU,但黃仁勳帶來的不是產品發布會,而是一場關於AI時代工業革命的敘述。

英偉達全新的宏大敘事,定義了這場革命的生產資料、生產方式、經濟模型,以及驅動一切的硬件基石和操作系統。

短短兩個小時,黃仁勳清晰地描述了英偉達的未來和整個AI行業未來的藍圖。

01「AI工廠」的誕生和「推理拐點」的來臨

黃仁勳在這場演講中提出了兩個核心判斷,作為英偉達的戰略基礎:

①推理拐點:AI從學習走向工作。

過去的兩年中,AI的算力消耗主要集中在訓練階段,各大AI企業都在費盡心思研究如何設計出功能更強大的模型,規模化法則(Scaling Law)也正是在這個階段生效:模型越大、數據越多,性能就越好。

如今,行業已經結束這個階段,進入了推理階段的爆發期,OpenClaw等產品的爆發讓AI模型被大規模地實際應用。

按照黃仁勳的說法,推理所需的計算量可能達到訓練所需的數萬倍甚至數十萬倍。

無論是ChatGPT、Gemini還是DeepSeek、豆包,每一次日常交流、每一次代碼生成都是一次複雜的推理。

因此,即使前沿大模型推陳出新的周期開始放緩,GPU需求仍然在持續暴漲。

而OpenClaw作為一款有極大安全風險的開源產品在全世界爆火,更是說明我們現在看到的增長,必然只是冰山一角。

②AI工廠經濟學:定義新世界KPI

推理的拐點到來之際,黃仁勳也給出了數據中心的新經濟模型:

Token將會成為新產品,數據中心不再是用於存儲數據的成本中心,而是生產智能的利潤中心,也就是所謂的「AI工廠」。

算力會成為新的貨幣,與token正向關聯。

而新的KPI指標,則是每瓦特電力能夠產生的token數量。

在美國,電力仍然是所有數據中心的最終物理瓶頸。最大化每瓦電力的token產出就等同於最大化收入。

通俗而準確的解釋,不僅使AI行業抽象的專業詞彙更加具象化,還將從CEO到開發者的思維都牢牢吸引到了英偉達最具優勢的賽道上。

在這套新的經濟範式下,英偉達的野心已經顯露:它掌握着大量的貨幣,不願意只給淘金的人賣鏟子,而是要打造整套「工廠藍圖」和「生產線」。

02「AI工廠」的核動力:硬件基石

英偉達最大的優勢就是算力,除了Google靠着自研TPU硬是打出了一片天地,世界上絕大部分企業仍然受制於英偉達的GPU供給。

推理需求的爆發,就意味着「AI工廠」需要消耗前所未有的能源。

值此之際,英偉達推出了宣傳已久的Vera Rubin。

相比以前GTC展示的單塊GPU,Vera Rubin是一台機架級的超級計算機。

本質上,它是一個極致垂直整合的產物,集成了新一代GPU、專為AI代理任務設計的CPU、新一代網絡、新一代存儲等七顆關鍵芯片,並結合液冷技術和精密協同設計,共同封裝在一個機架之中。

自此,英偉達的交付單位,已經從芯片躍升到即插即用的計算系統。

除此之外,這次GTC大會還有另一項技術驚喜,也就是Groq LPU技術整合。

英偉達已經注意到現階段的AI計算需求開始呈現極端化的趨勢:

一是高吞吐量,Vera Rubin擅長進行海量並行計算,適合處理批量任務;

二是超低延遲,Groq LPU有極快的單次響應速度,這是交互式應用的關鍵。

英偉達的解法,是在軟件層面上將所需的兩種能力「分而治之」,高強度的數學運算放在Vera Rubin上,對延遲極度敏感的token生成環節則交給Groq,這一解決方案將高價值交互應用的性能足足提升了35倍。

AI工廠的產出,遠不止數字世界的token。

在黃仁勳看來,具身智能(Embodied AI)這個更廣闊的物理世界大有可為。

但僅憑現實世界中的數據,想訓練機器人應對所有突發的陌生情況,恐怕永遠都不夠。

解決方案就藏在他提出的新經濟模型中:算力就是貨幣,貨幣就能帶來數據。

通過仿真平台生成海量高質量的合成數據,在虛擬世界中訓練AI,再部署到現實世界中的機器人中。這套Sim-to-Real的路徑,或許就是解決機器人智能化的關鍵。

當然,盲目的技術樂觀主義不可取,目前的AI模型基礎能力尚不足以支撐具身智能商業化落地。

不過,無論是通用的機器人基礎模型GR00T,還是具備思考和推理能力的自動駕駛模型Alpamayo,都證明了英偉達正在將「AI工廠」提供的生產力投入到了價值50萬億美元的製造業和汽車業。

03「AI工廠」的大腦:Dynamo 1.0

強大的「核反應堆」Vera Rubin已經誕生,接下來的問題就是如何讓它像小龍蝦一樣7×24小時高效運轉。

這個問題的答案,同樣藏在軟件層面。英偉達在GTC大會同期發布的Dynamo 1.0技術博客,正式將驅動「AI工廠」的大腦公開於衆。

Dynamo是一個專門為大規模、多節點、企業級AI推理而設計的軟件框架。如果Vera Rubin是token的硬件生產線,那Dynamo就是生產線的控制器。它雖然不直接生產token,但卻保證了生產流程的效率、速度和穩定性。

具體來說,Dynamo在以下四個方面實現了不同程度的技術突破:

1.在Vera Rubin平台上,Dynamo可以通過解耦服務等技術將模型的推理請求處理能力提升約7倍,直接提升了核心的「KPI指標」;

2.AI從Chatbot進化到Agent後,智能體的工作流運作需要經過多輪對話、後台思考、調用工具等複雜流程。而Dynamo具備「智能體感知」能力,能夠通過智能體提示(Agent Hints)理解任務的優先級,優先處理關鍵任務,將智能體應用的首次響應時間降低4倍;

3.現代AI應用普遍需要頻繁啓動新模型實例,但傳統方式下加載、編譯和優化模型耗時費力。Dynamo的ModelExpress技術通過檢查點恢復和模型權重流式傳輸等方法,將新實例的啓動時間加快7倍,「AI工廠」的生產將會更加靈活;

4.部署大模型對大部分人來說門檻仍然太高,Dynamo的DGDR功能允許開發者只提供模型、硬件和流量等目標,系統即可自動完成性能分析、配置和部署。

Dynamo的推出,完美印證了英偉達的領先已經不再侷限於硬件層面,還有深不可測的軟件和系統工程能力。

04英偉達的生態戰略

綜上所述,英偉達通過GPU構建起來的護城河,如今已經延伸到了生態戰略。

在演講中,黃仁勳將OpenClaw這個開源智能體框架比作AI時代的Linux,並判斷它會成為下一代的操作系統,且必將開啓一個全新的「智能體即服務」的時代。

此前的文章中我們曾提到過一個名為NemoClaw的平台產品,如今已經正式發布。英偉達的目標只有一個:讓自己成為這場技術革命的標準制定者和安全守護者,讓所有企業都能放心加入這場養蝦浪潮。

同樣的策略也放在了智能體底層的基礎模型上。通過成立Nemotron聯盟,英偉達聯合了Mistral、Perplexity等知名AI公司,試圖共同打造下一代基礎模型。如此一來,AI生態的軟件將與英偉達的硬件實現更深層的綁定。

這也正是黃仁勳的高明之處:

從芯片(Rubin)、系統(機架)、網絡(NVLink)、軟件(Dynamo)、操作系統(NemoClaw)到AI模型(Nemotron),英偉達在每一個環節都實現了深度自研和極致協同設計。

這種垂直整合的模式帶來的,是競爭對手難以比擬的性能和效率。

與此同時,英偉達也並未試圖獨吞市場。

與各大雲廠商和AI初創公司合作,表面上是「賦能所有人」,「給雲廠商帶來客戶」,實則是將自己的技術棧嵌入全球的計算平台,使整個生態系統都建立在英偉達的底層技術之上。

未來如果回顧2026年的GTC,或許它就是一個時代的轉折點。

英偉達構建了一個以token為商品、以算力為貨幣、以「AI工廠」為核心生產單位的全新經濟循環。

在這個循環中,英偉達有最高效的生產工具、最智能的生產管理系統,甚至定義了生產標準。

它不再是一家GPU供應商,而是AI基礎設施與經濟體構建者。

未來的「卡脖子」,只會更緊。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10