黃仁勳最新演講3萬字全文:Agentic AI已真正到來

王錚Silvia
06/01

Agentic AI已真正到來,核心架構是"LLM+Harness":大模型強大的推理規劃能力,與框架的工具調用、記憶管理和協調能力成熟,帶來質變。

黃仁勳:

非常高興見到你們所有人。回家的感覺真好。我把我的父母也帶回來了。大家為我的父母鼓掌——也為我們開場秀的超級明星鼓掌。女士們先生們,你們看他們多可愛。

今天有這麼多人在這裏。我們正在把這場演講直播到台灣另外70個觀看現場。70場不同的會議正在同時進行。所有人都在看這場主題演講。

我們有太多要告訴你們的事情,也有太多合作伙伴要感謝。台灣的生態系統變得如此龐大,令人難以置信。

大多數時候,人們談到生態系統,想到的是我們的軟件棧,是 Nvidia 構建的計算系統之上的開發者生態。但我們的生態系統向上遊延伸到台灣的整個供應鏈——一切從這裏開始——向下遊一直延伸到數據中心,最終到達終端用戶。

今天,我們幾乎要談及整個生態系統。有太多人要感謝。我熱愛台灣的生態系統。這裏有太多公司,有些是我最喜愛的生態夥伴。台灣豐富的生態系統,是最豐富的生態系統,是全球最好的供應鏈生態系統。令人難以置信。

感謝大家來到這裏。今年,我們的業務共同實現了驚人的增長。事實上,昨晚有人告訴我,台灣今年的年度 GDP 將增長接近 10%。好了,我們有很多要講,開始吧。

Agentic AI已真正到來,正讓軟件開發者

生產力暴增三倍,成為GDP引擎和利潤引擎

兩年前我在這裏,開始和大家談論 AI 是如何從生成式 AI 向其他浪潮演進的。下一波 AI 是 Agentic AI(智能體 AI)。

而今天,我們可以說:Agentic AI 已經到來,真正有用的 AI 已經到來。

這意味着什麼?這是 GitHub,當然是 Agentic AI 最早的應用之一——軟件編程。這是最有價值的職業之一,生態系統極其龐大——全球有 3000 萬到 4000 萬專業軟件開發者,加上學生和愛好者可能還要再多幾百萬。

但可以說,全球有 3000 萬到 4000 萬軟件開發者以編程為生,這張圖代表了其中大多數人。這是 GitHub。Pull request 是當他們下載軟件、進行修改的動作,commit 是他們把代碼提交回去的動作。

你們看看這個:2023 年,提交次數是 3 億次;2024 年,4 億次;2025 年,5 億次。而在 2026 年的頭幾個月,這個數字幾乎翻了三倍。

圖片

這意味着什麼?3000 萬軟件開發者代表了大約 3 萬億美元的 GDP 貢獻——他們的薪資總額就是 3 萬億美元,而這 3 萬億美元的薪資帶動了其餘產業的經濟增長。世界上大約 100 萬億美元規模的產業,是由這 3 萬億美元的薪資驅動創造的。

而現在,這 3 萬億美元的薪資正在產生近三倍的產出——實際上是用 3 萬億美元的薪資創造了 9 萬億美元的生產力。有沒有道理?這種差距絕對是非同尋常的。這就是 AI 的潛力,這就是 AI 的承諾。

軟件工程師的數量實際上還在增加。說 AI 在減少就業崗位——完全無稽之談。恰恰相反,AI 正在促使更多軟件工程師被招募。

原因很簡單:如果你能僱一名軟件工程師,然後他能創造 9 萬億美元的生產性工作,你為什麼不想多僱一些呢?如果那條曲線是平的,那麼人們自然會減少僱用。但因為產出如此驚人,人們反而想僱用更多軟件工程師。這種影響很快就會體現在我們的經濟中。

所以,第一點是:真正有用的 AI 已經到來。

從產業視角來看,這意味着 token 現在面臨着極其旺盛的需求——因為如果你能做到這一點,你會想要創造更多。

而且,由於 token 現在是有利潤的收入單位,AI 公司們希望構建更多 token,生成更多 token,建造更多 AI 工廠——這正是台灣的算力需求飆升的根本原因,也正是你們都如此繁忙、業務如此出色的原因。

事實上,那看起來就像是你們某些公司的股價走勢。

計算模式已經改變,一切都變了。所以第一個關鍵認知是:有用的 AI 已經到來。AI 現在是利潤引擎。AI 現在是 GDP 引擎。

Agentic AI的核心架構是"LLM+Harness"

大模型強大的推理規劃能力,與框架的工具

調用、記憶管理和協調能力成熟,帶來質變

在這背後,是一種全新的計算模式——不僅僅是一個大語言模型,而是一個智能體(agent)。

今天,我們幾乎所有要談的內容都將基於此。讓我用一點時間向你們展示我說的"內部"是什麼樣的。

這就是一個智能體——一個智能體應用。以前,這是應用程序,這是代碼,這是操作系統——應用代碼在應用程序內運行,應用程序在操作系統內運行。

圖片

今天,它是智能體——由一個或多個大語言模型,加上一個"框架(harness)"構成。框架幫助它、協調它去完成有價值的工作。

這是輸入。當輸入進來時,它需要理解、觀察、推理、行動、使用工具。那個工具可以是電子表格、網絡瀏覽器、數據處理引擎、數據庫引擎等等。

這一切都在被協調——這個框架每次都在協調信息的流轉:處理上下文、理解正在發生的事情、推理該做什麼、制定計劃並行動——整個協調路徑都由軟件來調度。

所以這從根本上就是一個智能體。它處理短期記憶(稱為工作記憶)和長期記憶——就像我們人類一樣,我們也有長期記憶。所以記憶管理系統極其重要。

這整個系統就叫做智能體。大語言模型用於思考,框架將一切連接在一起,就像操作系統一樣,這就是新的計算模型。這就是智能體能做的不可思議的事情。

這是一次重大突破:大語言模型能夠真正做好思考、推理、規劃、使用工具,同時我們擁有了管理記憶、協調調度、使用工具的框架——兩者同時收斂,我們現在能做的事情令人嘆為觀止。

讓我給大家舉些例子。這是一個提示詞。這是生成的代碼。這是輸入,那是輸出。你們覺得怎麼樣?很厲害,對吧?

我們這裏用的是 Claude Code,但 Codex 也表現得非常出色。再看另一個例子。輸入是:"創建一個 GIF——黑色背景上的 Nvidia 綠色光點,以散點形式分佈,變形為台北 101 大樓,再變形為 GTC 台北 2026,再變形為 Nvidia 標誌,然後散開。

(循環播放)

"你看到了那個提示詞。下一個例子:"我的遙控器電池卡扣丟了。"看起來就是這樣。"創建一個 CAD 文件——使用工具,創建可用於 3D 打印的 CAD 文件,做一個新的卡扣。"

這就是新的計算模式:以前我們打開應用程序,點擊和打字;現在我們換成向 AI 解釋我們想要什麼、我們的意圖,然後 AI 生成代碼或使用工具,產生必要的輸出。這就是未來計算機的工作方式。

這就是 Agentic AI。兩年來,我們一直在為此而構建,現在它已經到來。

Agentic AI將開啓軟件公司黃金時代

CUDA X庫將成為智能體最強大工具,

推動計算模式根本變革

當然,工具的使用是一大突破。

很多人曾經說:"Jensen,AI 來了,Agentic AI 來了,所以所有軟件公司都會倒閉。"我說恰恰相反——因為將有如此之多的智能體,世界將不再受人口數量的限制,因此那些智能體將比以往任何時候都使用更多的工具。

對於軟件公司來說,這其實是一個難以置信的好時代——但軟件必須以智能體能夠使用的方式呈現給它。這是一個重大突破。

事實上,我們已經做到了——正如你們所知,Nvidia 的寶藏是我們所有的 CUDA 庫。我稱之為 CUDA X 庫。這是 Nvidia 的寶藏。

今天,我們能夠將這些 CUDA X 庫呈現給智能體——智能體甚至比人類更能有效地使用它們。所以現在是 CUDA X 大展身手的絕佳時機。我們來看看。

圖片

【產品介紹視頻】— CUDA X 庫

「二十年前,我們構建了 CUDA——一個用於加速計算的統一架構。

我們重新發明了計算。1000 個 CUDA X 庫幫助開發者在科學和工程的每一個領域取得突破。

CUDA X 庫就是智能體的工具。cuLitho 用於計算光刻;cuOpt 用於決策優化;cuDSS 用於直接稀疏求解;AIQ 用於跨結構化和非結構化文檔的深度研究;Aerial 用於 AI RAN;Warp 用於可微分物理;PhysX 用於基因組學。

在這一切的根基上,是算法——而算法是美的。」

圖片

為美妙的數學鼓掌。軟件的計算模式將要改變。讓我們回到這裏。

這就是智能體。它是終極的去中心化、分佈式計算模型。為了處理這個智能體,將有非常多不同的計算機被激活。

智能體由模型、框架、工具與技能(skills),以及運行時(runtime)組成。這一切都運行在數據中心的不同地方。

你可以把模型想象成大腦,框架是身體,它使用的工具運行在運行時中——把它想象成一個工坊。所以這就是一個人,一個工人,在工坊裏使用工具工作。

當然,這是在極其大的規模上進行的,每個步驟都運行在計算機的不同部分。你可以看到,大語言模型在思考——處理上下文、觀察、理解環境、推理、制定計劃、執行計劃。

每次這個過程發生,一整個機架的 Grace Blackwell NVLink 72 都會被激活。它在用大語言模型思考。每當它使用工具時,就會用到 CPU——那個工具可能是 C 編譯器,可能是 Python,可能是 JavaScript,也可能是加速計算。

今天的智能體對工具的使用還比較簡單。明天,它們將成為非常成熟的工具使用者——這就是為什麼我向你們展示的 CUDA X 庫將來在智能體中會極受歡迎。

它們解決了世界上一些最重要的問題。我們所有的 CUDA X 庫現在都會附帶技能(skills),讓 AI 學會如何使用它們。CUDA X 庫有技能——基本上就是一本說明書,AI 讀完後會想:"啊,原來是這樣用的。"智能體使用這些庫的能力將會是驚人的。

Agentic AI驅動全新異構計算架構,Vera Rubin是端到端系統級革命,Vera是專為Agentic系統設計的全新CPU,將開闢一個全新、更大的市場

Agentic AI驅動全新異構計算架構

Vera Rubin是端到端系統級革命,

而非單純的芯片升級

所以,工具在 CPU 和 GPU 上運行,大語言模型負責思考,安全框架運行在 CPU 和安全處理器(DPU——Nvidia 的 BlueField)上,整個系統的協調在 CPU 上運行。這是整個框架,CPU 協調着所有的工作。


最難的部分之一是記憶。可以想象:工作記憶叫做 KV 緩存。要記住什麼、壓縮——不只是壓縮,還有如何檢索。檢索結構化數據?檢索非結構化數據?所有這些不同數據之間的關係本體論是什麼?整個處理過程極其複雜。AI 的記憶系統將使存儲系統發生徹底的革命。

可以看到,這種計算模型的每一個方面——這個叫做"智能體"的新應用——都和以前應用程序的運行方式根本不同。以前是一大堆軟件坐在一個二進制文件裏,坐在操作系統裏。

正是這種去中心化、分佈式、異構的計算挑戰,是我們構建下一代 Vera Rubin 的根本原因。

圖片

Vera Rubin 不是一顆芯片。Vera Rubin 不僅僅是 GPU。它從 GPU 開始,但 Vera Rubin 極其不凡。

從端到端,整個系統都是 Vera Rubin:它有 GPU,有 Vera Rubin NVLink 72,它由 Vera CPU 來協調——關於這個我稍後會詳細介紹。

存儲系統,革命性的 Vera,加上 CX9,加上 DOCA 軟件棧,以及內置的安全處理器——讓靜止時、傳輸中乃至使用中的一切都被加密。整個系統中的一切都是安全的,因為 AI 模型太寶貴了。這就是為什麼整個系統遵守保密計算規範。

這些系統中的每一個,單獨來看都是一場完整的革命。Vera Rubin 是我們公司歷史上最宏大的壯舉。全公司所有 4 萬名工程師都參與了 Vera Rubin 的工作,更不用說你們所有人也參與了這個整體系統的創造。

Vera Rubin 真的是個奇蹟。而且它不只是一顆芯片,它包含了太多太多。

客戶的需求不再是買電腦,而是建AI工廠

未來10年內將有100吉瓦的AI工廠上線,

DSX平台運行最高效率、最低成本的token

那還有更多嗎?很久以前,Nvidia 只是一家 GPU 公司。但多年來,我們演進了。我們成為了一家系統公司——你們現在看到的是有史以來最複雜的系統,從零開始設計的最複雜系統。

但歸根結底,我們的客戶和合作伙伴不想買電腦——他們想建 AI 工廠。這就是為什麼 Nvidia 又一次開始深刻轉型。

你們可以看到,我們的技術現在已經延伸到整個基礎設施層面。我們的合作伙伴處於基礎設施層面——發電企業、冷卻系統、電網供應商。如此之多的工業公司現在已經成為我們生態系統的一部分,因為我們最終是在嘗試構建一整個技術棧。

就像 GPU,就像我們當年構建 Grace Blackwell NVLink 72,就像我們現在正在構建完整的全棧系統,讓我們的客戶能夠建造出色的 AI 基礎設施。我們來看看。

圖片

【產品介紹視頻】— DSX AI 工廠平台

「世界正在競相建造 AI 工廠——人類歷史上規模最大的基礎設施建設浪潮。AI 工廠極其複雜:每一層——芯片、機架、網絡、電力、冷卻、電網——都必須從端到端整體設計,因為算力就是營收。

Nvidia DSX 是這張藍圖——一個以最高效率和盈利能力建造並運營 AI 工廠的參考設計。

它從 DSX Sim 開始:藉助 DSX Sim Omniverse Blueprint,合作伙伴可以在第一個機架落地之前,先設計和驗證一座 Nvidia Vera Rubin AI 工廠——規劃佈局、模擬電力和冷卻、設計網絡、驗證每一項集成、在數字孿生中測試每一處變更。

工廠通電後,DSX OS 接管,負責配置、運營、監控和修復基礎設施,將已安裝的系統轉化為可信賴的、多租戶、高彈性、AI 就緒的算力資源。

圖片

當今的 AI 工廠在電力方面超額配置高達 40%。DSX MaxLPS 讓運營商在相同的電力預算內安全部署更多 GPU,每年增加數十億美元的收入。

突破性的 45 攝氏度熱液冷卻技術減少了水和能源的消耗,讓更多電力流向創造收入的計算。動態電力分配在機架之間調度功率,回收閒置瓦特,將它們送往有工作需求的地方。電力平滑技術抑制整個工廠的峯值電流尖刺和功率浪湧。

AI 智能體團隊持續與 DSX MaxLPS 協作,動態平衡冷卻與電力以響應工作負載需求。DSX AI 工廠是靈活的能源資產,可與電網協作運營。DSX Flex 讀取實時電網信號,在電網需要減負時動態調整工廠功率。

10 年內將有 100 吉瓦的 AI 工廠上線。Nvidia DSX AI 工廠運行效率最高,生產成本最低的 token,並讓電網更穩健。」

AI雲在各國快速興起,服務本地及全球客戶

這些AI雲都需要NVIDIA完整的底層技術棧

和全球開發者生態

我曾經向你們展示過生態系統幻燈片,那時 Nvidia 的計算層、軟件和計算棧被整合進其他人的平台——第三方平台和庫——服務於終端市場。那是一個計算生態系統。

圖片

這是一個 AI 工廠生態系統——在我的下游。在我的上游是你們所有人,在我們的下游是這個生態系統。因為 Nvidia 最終不只是在製造 GPU,不只是在製造系統——我們在幫助客戶建造 AI 工廠、AI 基礎設施,而這是極其複雜的事情。

每一座達到 1 吉瓦規模的 AI 工廠,一開始是 200 到 300 億美元,現在是 500 到 600 億美元,很快將達到每吉瓦 800 到 1000 億美元。1000 億美元投入一座 AI 工廠——它必須第一次就能工作,必須立刻運轉。資本成本之高令人咋舌,複雜程度令人嘆為觀止。

所以,我們以前是在電腦裏設計一顆芯片,然後在電腦裏仿真一個系統。今天,你們啱啱看到了——一切都在 Omniverse 裏構建。

我和你們一起用 Omniverse 工作已經很久了。這是夢想成真——這樣我們就能在數字框架、數字仿真器、數字世界裏建造這些巨大的系統,大到世界想要建多大就能建多大,而且是在我們破土動工、投入資金之前很久就先做到這一點。這就是我們的生態系統,我們稱之為 DSX。

RTX 是我們的 GPU;DGX 是我們的系統;現在 DSX 就是基礎設施。正是因為我們在這整個技術棧上所做的工作——包括我們的系統和軟件——才使我們能夠與小型公司合作,讓他們成為世界級的 AI 雲。

我接下來要展示的每一家,不久前都還是小公司,而現在 CoreWeave 已經價值 600 到 700 億美元,而且還在快速增長。最近,我們與 Nebius 合作——他們也在飛速增長。

圖片

這些雲的客戶都極為出色。Cursor,軟件編程公司。Black Forest Labs,圖像生成。World Labs,世界基礎模型。Revolut,領先的金融服務 AI 公司。還有 Shopify。

再看另一家。這是 NScale,他們的客戶有英國電信。Google 正在使用我們的一家 AI 雲。Thinking Machines,Frontier Labs 的公司。非常令人振奮。

圖片

這是韓國的 Naval Cloud——韓國銀行、現代汽車,還有許多令人嘆為觀止的公司。這是印度的 Yotta,了不起的公司。

圖片

這是一家總部在新加坡、在澳大利亞建設的公司——Together AI,新加坡。這是印度尼西亞的一家。這些公司中的每一家都在服務區域性及全球性客戶。

AI 將無處不在。每家公司都將由它驅動。每個地區都將建造它。印度尼西亞的 Indosat。台灣的 GMI——可以鼓掌。

太了不起了。如此多了不起的公司,如此巨大的機遇。但他們都需要幾樣東西。當然,他們需要計算技術棧——這整個底層技術棧,這是讓 Nvidia 聞名於世的東西。我們所有的硬件、軟件和庫,以及我們與全球第三方開發者生態系統的連接,讓任何人都能搭建起一個 AI 雲。

算力即營收,TCO定勝負,選擇Nvidia

的三大理由:快速上線與啓動,頂級的

每瓦token吞吐量,系統使用壽命更長

但是,AI 雲現在如此複雜了。這是軟件版本,計算機科學版本。資產版本是我之前展示給你們的——那是一座巨大的工廠。

僅憑這種能力還不夠,這就是為什麼 Nvidia 現在已經成為一家 AI 基礎設施公司。在這方面做得出色——在幫助客戶建造並部署 AI 工廠方面變得極其精通——至關重要。原因在於:算力就是營收。算力就是利潤。沒有營收和利潤就是虧損。

所以,真正重要的是:當一個 AI 基礎設施上線時——它可能上線得很快,也可能需要一段時間。它的吞吐量可能很高,也可能很低。它的彈性和可靠性可能好,也可能差。它的有效使用壽命可能很長,也可能很短。因為這代表着 500 億到 600 億直至 1000 億美元。

這條曲線至關重要,這就是為什麼與 Nvidia 合作是如此強大的事情——因為我們具備全面集成的能力。我們不是只拿出一張 PPT 幻燈片,我們創造了整個基礎設施。

我們將一切連接起來,我們自己也親自大規模建造了這一切,以確保一切運轉良好。因此,我們的首次 token 時間、首次推理時間、訓練啓動時間都要快得多。

其次,我們每瓦吞吐量,也就是每瓦 token 數,是絕對的世界頂級水平。原因在於我們整合一切、從零開始設計一切、仿真整個系統,並採用極致協同設計——就像我剛纔在 Vera Rubin 機架演示中向你們展示的那樣。

一切都是為了實現這種驚人的吞吐量而設計的。如果你的數據中心、你的工廠有 1 吉瓦,就只有 1 吉瓦——不會更多。1 吉瓦就是 1 吉瓦,那是你能使用的全部發電量。有了 1 吉瓦的功率,每瓦吞吐量就是營收,因為每一個 token 都是有利潤的。每一個 token 都是營收。

這就是未來。算力就是營收。每瓦性能就是你的營收。僅僅因為芯片更便宜就選錯架構,這根本說不通。你需要確保你的營收最大化。買得越多,掙得越多。所以,token 就是營收。

接下來的因素是可靠性。如果你有機會去看看這些數據中心——有如此多的活動部件,數百萬條線纜,要讓所有那些計算機和諧協作,可靠性極難保證。我們已經在極大規模下運營了很長時間,這種經驗非常重要,中斷時間間隔的差異極為關鍵。

最後一點,也是非常困難的一點:系統的使用壽命。

軟件一直在變化。四年前,也就是 Hopper 的時代,AI 已經徹底改變。六年前,Ampere 的時代,AI 已經徹底改變。

我們一開始談的是 CNN,然後我們談 Transformer,然後混合專家模型,現在我們在談 Agentic 系統。每一代,每隔幾個月,軟件行業都會湧現出新技術。

如果你的架構不夠靈活,如果你的生態系統不夠豐富,那麼這條曲線就無法延伸很長。你無法預測你的系統能使用多久。

但我能。Nvidia 的系統遍佈全球,軟件開發者從 Nvidia CUDA 起步——因此,這個生態系統、這個可用資產的生命周期自然會長得多。差別在本質上就是成本。你可以從營收角度看,但營收的另一面就是成本。如果資產的使用壽命長,總體擁有成本(TCO)就低。這就是差別所在。

Vera Rubin已全面量產,供應鏈規模是

Grace Blackwell的兩倍,單機架組裝

時間從兩小時壓縮至5分鐘

你們所有人正在和我一起經歷這一切,對吧?你們的需求,你們的工廠在拼命運轉,你們的員工在台灣各地拼命工作。因為每個人都想賺錢。他們意識到,有用的 AI 來了,有利潤的 AI 來了,算力需求極其旺盛——算力需求就是那個制約因素。

所以讓我們一起拼命工作,幫助世界到處建立 AI 工廠。這就是為什麼這件事如此重要。

我非常高興。我站在你們面前宣佈:Vera Rubin 已進入全面量產。

圖片

Vera Rubin 已進入全面量產!我們為 Vera Rubin 建立的供應鏈是 Grace Blackwell 的兩倍規模。令人難以置信。

而且,以前組裝一台 Grace Blackwell 機架需要兩個小時,現在只需要 5 分鐘。所以不僅產能更高,生產效率也快得多。而且我們全都需要,來支撐這樣的需求。

這個生態系統非同凡響。數百萬平方英尺的產能已經上線,支持 Grace Blackwell,現在正在準備、正在提速——Vera Rubin。我想感謝你們所有人。

Vera Rubin 現已全面量產。謝謝大家。我們來看看。

圖片

【產品介紹視頻】— Vera Rubin 量產與供應鏈

「大語言模型生成答案。而今天,AI 智能體能夠完成真正的工作。

但處理 Agentic AI 是一個完全不同的計算問題。智能體需要觀察、推理、規劃、使用工具,管理海量的上下文,同時兼顧工作記憶和長期記憶,還要按需啓動子智能體作為專家。

Vera Rubin 是一個多機架、機群(Pod)級規模的系統,專為處理 Agentic AI 而生,現已全面量產。整個供應鏈中製造自動化與統籌協調的景象——真是奇蹟。

圖片

我們的旅程始於第一台 AI 超級計算機 Nvidia DGX1 的發布。在接下來的十年裏,我們把每一顆芯片和每一個系統都推向了極限——從 Pascal 和第一代 NVLink,到 Grace Blackwell(第一台機架級 AI 超級計算機),再到現在的 Vera Rubin——第一台為 Agentic AI 時代而生的多機架機群級超級計算機。

一切從台積電開始。構成 Vera Rubin 的七顆新芯片,經過數百道工序成型。3 納米制程。CoWoS-R 和 CoWoS-L 封裝。

來自美光、SK 海力士和三星的 HBM 內存。

Vera Rubin 計算單元:6 萬億個晶體管,單塊板卡超過 18000 個元器件。Vera Rubin NVL72 負責"思考"——提示詞與上下文理解、推理與規劃。

接下來是全新模塊化計算托盤,採用全新 PCB 中板設計大幅簡化。超級芯片、ConnectX9、SuperNyx、BlueField 4 DPU——全部就地集成,無需線纜,實現 AI 工廠規模的高可靠性。

18 個計算托盤。9 個熱插拔 NVLink 交換機托盤。全新高效歧管。液冷母排,承載超過 5000 安培的電流——相當於 20 輛電動汽車滿速加速時的功率。

共計 130 萬個元器件,構成第三代 MGX 機架設計。

恭賀微軟成功運行 Vera Rubin NVL72 工程驗證機架。同樣恭賀戴爾和 CoreWeave 成功搭建 Vera Rubin NVL72 工程驗證機架。

然後是 Vera CPU 機架:單個液冷機架內 256 顆 CPU,負責協調模型、調度內存、啓動工具——在富士康和廣達完成生產。

Grok 3 LPX 成型:16 個托盤共 256 顆 Grok 3 LPU。40 PB/s 的 SRAM 帶寬,實現超低延遲。NVL72 以最高吞吐量生成 token,而 Grok LPX 以最低延遲生成 token。

Vera BlueField 4 STX——AI 的記憶所在之處。BlueField 4 加速存儲處理,連接內存與存儲。

以及硅片層面:Nvidia Spectrum-X 以太網光子模塊——全球首款搭載 200 吉比特協同封裝光學模塊的以太網交換機。台積電的 CoWoS 工藝,芯片級封裝,磷化銦上的超高功率激光芯片。

Vera Rubin:5 套相互連接的機架級系統——一台為 AI 智能體而生的超級計算機。台灣遍佈各地的 150 家供應鏈合作伙伴。數百萬平方英尺的廠房。數百個生產點位。芯片、封裝、系統和數據中心,在尺寸、功率和規模上都被推到了極限。

圖片

這就是我們所說的"極致協同設計"。我們和台灣一起完成了這一切。攜手共進,我們為 AI 時代重新發明了計算。台灣在起點時與我們同行,今天又見證着我們將 Vera Rubin 帶到世界。謝謝,台灣。」

詳解Vera Rubin NVLink 72機架全系統

專為Agentic AI設計,是世界上運行復雜

智能體的最先進計算平台

女士們先生們,Vera Rubin 不只是為了 AI 而生。Vera Rubin 不只是為了運行 AI。Vera Rubin 是為了運行智能體而生。這是一個 Agentic 系統。

想象一下其中的複雜性——這也是為什麼智能體是計算機科學最後一次重大突破。花了這麼多年,智能體才終於實現了它的潛力、變得真正有用。運行它的計算機,理應是世界上最先進的。這就是 Vera Rubin。

能不能把 Vera Rubin 帶出來?Janine,機架和系統準備好了嗎?看起來很重。這是 Vera Rubin NVLink 72。這是 Grok LPX。在下次 GTC 上,我會向大家更多介紹這些內容。今天我們有太多要講。

圖片

這是 Vera CPU 機架——256 顆 CPU,全液冷。等一下我會介紹 Vera CPU 的細節。這是 Vera BlueField 存儲處理系統,也是安全系統。當然,這是我們的 Mellanox 網絡——全球首款 CPO(協同封裝光學)交換機。這就是 Vera Rubin。令人驚歎的技術全部匯聚於此。

當年我們做 Hopper 的時候,是為了預訓練——當時預訓練是最重要的應用,是我們最重要的工作負載。

後來我們做 Grace Blackwell 的時候,所有人都說:"Jensen,Nvidia 在預訓練上真的很厲害——但推理很簡單,我們也能做。"大家還記得嗎,人們曾經說"推理太簡單了"。

但如你們所知,推理等於金錢,而 MoE 模型極其複雜——要同時實現超高響應速度、快速交互性和高吞吐量,極其困難。這就是我們創造 NVLink 72 的原因。

今天,Nvidia 的 token 成本是全球最低的——不是低 10%,是 X 倍,是數量級的差距。完全是因為我們做了極致協同設計,完全是因為我們理解了推理的計算模型和計算模式,因而能夠創造出 NVLink 72。

圖片

現在有了 Vera Rubin,它超越了推理。它現在是在一個 Agentic 系統中做推理。這就是 Vera Rubin。

沒有線纜,沒有水管,沒有風扇。上次我向大家展示時,到處都是線纜,看起來蔚為壯觀。但現在中間有一塊 PCB 把兩側連接起來。以前需要兩個小時的事,現在只需要 5 分鐘。Vera Rubin 的可靠性和彈性將會無與倫比。

這是我們的 Vera CPU 托盤——有史以來製造出的最先進的 CPU。我馬上會為大家展示。這是我們的存儲托盤——兩顆 Vera CPU,4 顆 CX9,大量軟件。

這是我們全新的 LPX——Grok 系統,專為極低延遲推理而設計。吞吐量由 Vera Rubin 提供,並由 NVLink 72 進一步擴展。如果想進一步擴展,還可以加上 Grok LPU。

圖片

這是 Vera Rubin NVLink 交換機托盤——交換機就在中間。這非常革命性,正是因為 Vera Rubin、NVLink 72,以及我們創造和發明的 NVLink 交換機。

這是我們用於橫向擴展的以太網交換機。令人驚歎的是,我們最初為 Grace Blackwell 引入了這兩套系統。這兩套系統是為 Grace Blackwell 創造的。

而今天,Nvidia 是全球最大的網絡公司。我為網絡團隊感到無比自豪。這是我們所做一切的最強大推動力。

過去CPU為人類設計,如今智能體工作在

納秒級世界,需要極致低延遲和高交互性

Vera CPU是為智能體而生的處理器

接下來我要談我們將要進入的下一個重要產業,我們來談談 CPU。

讓我們來談談 CPU。Vera——為 AI 時代而生的 CPU。

迄今為止,所有 CPU 都是為人類創造的。我們是用戶,我們是租戶。我們使用 CPU 的方式——我們生活在以秒為單位計量的世界裏。我們在雲端租用 CPU 的方式——CPU 核心越多,能租出去的越多。

舊 CPU 的經濟模式和使用方式,與智能體的需求根本不同。智能體是沒有耐心的。它們不生活在以秒為單位的世界裏,它們生活在以納秒為單位的世界裏。

當它使用一個工具時,它需要響應時間儘可能短。當它訪問數據庫時,必須儘快返回結果。智能體每等待一刻,就少走了一步。讓 CPU 儘可能低延遲、儘可能高交互性至關重要。

所以我們為 AI 時代創造了 Vera CPU。

圖片

在我們的系統裏,Vera CPU 有三種使用方式——實際上是四種。

第一種,當然是 Vera Rubin 負責"思考"。

Vera Rubin 機架內部已經有兩顆 CPU。如你們所知,我們正在生產並銷售數百萬台 Vera Rubin。我們已經賣出了數百萬台 Grace Blackwell。Nvidia 已經是全球最大的 CPU 製造商之一了。

在 Vera Rubin 機架裏有兩顆 CPU:

一顆用於協調和管理 GPU、管理 KV 緩存、處理機架內運行的所有軟件;另一顆是 Grace BlueField,用於安全和隔離。

Vera 計算 CPU 用於框架、AI 模型的協調調度、工具使用、數據庫訪問。而數據服務器就在這裏——Vera BlueField——全世界速度最快的存儲服務器、最快的存儲系統。這之所以如此關鍵,是因為智能體訪問內存的速度極其驚人。

這些系統——存儲服務器和 CPU——現在是數據中心最昂貴部分的關鍵路徑。之所以最昂貴,有充分的理由:AI 工廠的經濟學基礎就是 token,而 token 就在這裏被創造出來。所以當然你希望儘可能多地生產和生成 token。這裏是你投入全部經濟資源的地方,而它必須不能成為瓶頸。

因此,Vera CPU 承受着極大的壓力——對 CPU 架構的壓力——這就是為什麼我們從零開始構建了一個全新的架構,一個世界從未見過的 CPU。我們叫它 Vera。

Vera的四大特性:極致單線程性能、

頂級每核帶寬、超高總帶寬、極致能效

在真實單線程性能上實現了巨大提升

這是為智能體而生的 CPU。以往所有的 CPU,我們是為人類而建的。這顆 CPU,是為智能體而建的。

有四個關鍵要點。

第一個要點:Vera 的每時鐘指令數(IPC)必須極其出色,因為我們需要延遲儘可能短。單線程性能——不是吞吐量,是單線程性能——必須是世界頂級水平,是絕對最好的單線程性能。這就是為什麼 Vera 的 IPC 如此之高,是全球最高的。每個時鐘周期取址、譯碼並執行 10 條指令。

第二點:CPU 數據進出所需的帶寬必須是絕對的世界頂級。這是每核帶寬。

第三點,就是純粹的帶寬——總帶寬。我們要移動——記得我之前說過,Agentic 系統從根本上是去中心化和分佈式的。當計算去中心化和分佈式時,網絡互聯就成了問題所在。

因此,我們必須在 CPU 核心之間、CPU 與存儲之間、CPU 與 GPU 之間,儘可能快速地移動數據。系統內部和 CPU 核心內部的帶寬必須是絕對的世界頂級水平。

這是很久以來第一顆真正達到光刻極限的 CPU——用一個連接所有 CPU 核心的互連架構,以光速運行:3.6 TB/s。沒有多芯片堆疊,沒有跨芯片邊界。因為 CPU 核心之間需要以極高帶寬相互通信。它們不是按核出租的,它們全部協同工作。

Vera 的截面帶寬高得離譜。它是第一顆支持 PCIe Gen 6 的 CPU,也是第一顆支持 LPDDR5 DDR5 的 CPU,帶寬高達 1.2 TB/s——是市面上最高性能 CPU 的兩到三倍帶寬。內部帶寬是外部的三倍,每核帶寬和總帶寬都是世界頂級。

現在記得我之前展示的——CPU 核心數量、CPU 的數量將會非常可觀。

原因非常簡單。我們以前為人類製造 CPU,而人類只有約 10 億在積極使用計算機。而智能體將有數十億個。這些智能體使用 CPU 時沒有耐心,因為它們旁邊 GPU 的成本太高、太寶貴。

因此,這些 CPU 既需要高性能,也需要極高的能效——這樣我們才能在工廠裏塞下儘可能多的 CPU,又不從 token 生成中搶走電力,而 token 生成纔是我們賺錢的方式。

這四個特性——每時鐘指令數(即單線程性能)、每核帶寬、芯片內外總帶寬,以及能效——定義了 Vera。與最高性能的 x86 相比,它絕對是世界頂級。在真實單線程性能上,簡直不在一個維度。

能在 CPU 上實現 5% 的提升,就已經很了不起了;10% 的提升,同樣了不起。但這種幅度的性能提升,聞所未聞。

這就是 Nvidia Vera。你們覺得怎麼樣?

圖片

【產品介紹視頻】— Vera CPU 架構

「Agentic AI 改變了 CPU 的角色。CPU 現在是指揮家,GPU 是管弦樂團。

傳統 CPU 是為另一個時代而建的——最大化每插槽核心數,切分、虛擬化,按小時出租。而在智能體時代,CPU 已成為 GPU 利用率的瓶頸,直接影響 token 吞吐量、延遲和用戶體驗。

Nvidia Vera 是為 Agentic 循環而生的 CPU——將 Nvidia 自研的數據中心 CPU 核心與可擴展一致性互連(SCF)相結合,在性能、核心數和帶寬之間取得恰當平衡,以最大化 AI 工廠產出。

圖片

Vera 的核心是 Nvidia Olympus Core,專為現代數據中心工作負載而構建:分支密集的 Python 運行時、工具調用和沙箱代碼執行。每顆核心都針對吞吐量進行了調校。神經分支預測器,每個時鐘周期評估兩條預測分支。

10 寬解碼引擎,每個時鐘周期引入更多工作。大型亂序執行引擎,保持指令持續流動。配備新型圖引擎的高級預取器,預判下一條數據路徑。

但核心再快,數據必須正確、及時到達纔有意義。Vera 是第一顆使用 LPDDR5X 內存的 CPU,能夠在不損失帶寬的情況下同時糾正多個錯誤。相比 x86,Vera 實現了 40% 更低的峯值內存延遲——在檢索分析和沙箱執行過程中,始終保證核心的數據供給。

Nvidia 第二代可擴展一致性互連,將所有 88 顆 Olympus Core 統一在單片 Mesh 上,內存和 I/O 採用獨立芯片。核心不會跨三芯片組分割,實現了比傳統 CPU 快 50% 的核間通信。

內存一致的 NVLink 芯片間互連,將 GPU 直接連接到互連網絡。在 GPU 之外,NVLink 芯片間互連還能將 Vera 擴展到多個插槽,實現 CPU 之間的超大帶寬。

Vera 的 Agentic 沙箱性能是 x86 CPU 的 1.8 倍。獨立 Vera 機架運行智能體沙箱、工具、代碼和數據管道,與 Rubin GPU 緊密耦合,Vera 保持加速工作流持續運轉。

Nvidia Vera BlueField 4 STX 驅動上下文內存與 AI 存儲——計算、網絡、存儲三位一體。Vera,為智能體時代而生的 CPU。」

這將是我們新的主要增長驅動力。評測已經陸續出來了,都非常好。真的很厲害。

Vera是專為Agentic系統設計的全新CPU

SQL查詢速度提升3倍、實時流處理速度提

升6倍,將開闢一個全新、更大的市場
還要記住,Grace 和 Vera 也是 AI 領域資格最完備的 CPU——因為每一個數據中心、每一朵雲、每一家企業,每一家與 Nvidia 在 AI 上合作的公司,都已經對 Grace 完成了適配認證。整個軟件棧都已經針對 Grace 進行了優化。每家公司都將對 Vera 進行認證。

Vera 將成為全球最優化的 Agentic CPU,原因很簡單:它將隨 Vera Rubin 一同出貨,原因是我們做出了這個艱難而重要的轉變。

事實上,在 Grace Blackwell 的過渡期間,最大的風險就是從外部的 x86 CPU 遷移到 Grace Blackwell。那次遷移極具風險,但我們以令人嘆為觀止的執行力完成了它。

現在,Grace 已經和 Grace Blackwell 畫了等號。人們說 Blackwell,就是在說 Grace Blackwell——因為它現在已經無處不在了。每家公司的軟件棧都已針對它優化,每家公司的安全棧都已針對它優化。

現在,Vera 來了。我對此無比興奮。

圖片

來看看一些性能數據。

速度提升是一方面。要給 SQL 提速極其困難。SQL 是有史以來最著名的領域特定語言——你知道,在 CUDA 之前有 SQL,在 OpenGL 之前有 SQL——SQL 由 IBM 發明,今天是整個地球的結構化數據庫引擎。

人人都在用 SQL。這是 SQL 運行速度提升三倍——不是提升 10%,不是提升 25%,是三倍速度。令人難以置信。

下一個是實時流處理。記住,你的 AI 將不只是在讀文檔。你的 AI 將在監測遙測數據——尤其是工廠內部、股票交易所內部。你將持續監測遙測數據。

湧入的數據洪流進入 CPU。這是 Vera CPU 運行實時流處理的表現。紐約證券交易所的 Lynn Martin 總裁非常慷慨地與我們開展了合作。

這套系統在全球實時運行。流處理方面,Vera CPU——快了六倍。全都來自於帶寬、單線程指令執行效率、核間內部帶寬,以及外部帶寬。Vera 是徹底的革命。

你知道,X 倍的提升,通常是在談 GPU 時纔會提到的。在與 CPU 相關的真實工作負載上談 X 倍提升,實屬罕見。我為這個團隊感到無比自豪。你們做得太出色了。

我們有非凡的路線圖即將到來。但真正令人興奮的是,幾乎所有人都像我們一樣對 Vera 充滿熱情。Vera 正在打開一個全新的市場,一個以前從不存在的市場。

Agents(智能體)是一種新的工作負載。以前我們為人類製造 CPU,現在我們需要為智能體制造 CPU,為 Agentic 系統製造 CPU。它們的特性要求是不同的。為什麼舊 CPU 還能適用?我們正在生產數以百萬計的 Vera。

與我們攜手開拓市場的:台灣的 ODM 和計算機製造商,以及所有 OEM 廠商。你們可以看到,早期採用者正是那些 Agentic 公司。

這是一個新市場的開端,一個以前從未存在過的市場。它不會侵蝕舊市場——但這是一個全新的市場:為智能體而生的 CPU。而且這個市場一定會比上一個更大。原因很簡單——智能體的數量將遠超人類。而且智能體非常沒有耐心。

所以,Nvidia Vera CPU——謝謝大家。

與微軟合作推出RTX Spark,標誌着PC進入全新「智能體輔助計算」時代,PC將像當年的手機一樣被徹底再發明,未來每棟房子都可能擁有一台AI超級計算機

Nvidia企業AI智能體工具包,針對企業構建

「智能體即服務」而推出,包含四大核心組件:

模型、框架、工具與技能、運行時OpenShell

這是最重要的一張幻燈片。要傳遞的核心信息是:這是未來十年的應用模式,也是計算模式。

圖片

智能體與框架,協調編排大語言模型。每家公司都將運行它。每家公司都將成為智能體公司。每家公司內部都將運行智能體。每家公司都將看到,智能體需要自己的操作系統。

每家公司都在問我們:"我們怎麼安全地運行智能體?我們怎麼為自己的工作負載構建智能體?"因此,我們推出了 Nvidia 企業 AI 智能體工具包。

圖片

你們一直看着我把這一切構建在大家眼前。Nvidia 做的幾乎每一件事——如果你回頭看我五年前或十年前的 GTC,你就會看到今天這一切。你們已經看我談論這些好幾年了,因為我們一直在為這一刻而構建。

企業要構建"智能體即服務"或運營智能體,需要四樣東西:

第一:模型——大語言模型。越智能越好,越便宜越好,越快越好。

第二:需要一個框架來協調整個系統。

第三:這些模型想要使用工具。這些工具帶有各自的技能(skills)。我向你們展示了 CUDA X 庫——那些將來會是智能體的驚人工具。

第四:需要一個運行時——把一切粘合在一起的操作系統。

這就是 Nvidia 智能體工具包。它包含可供修改的模型——Nvidia 的世界級開放模型。你可以運行任何人的智能體——Claude Code,出色的智能體;Codex,出色的智能體。你可以在叫做 Open Shell 的框架裏運行它,它對企業內部使用具有極高的安全性。

Shell 保護智能體,使其受安全策略約束,隱私受到保護,權限和權利得到賦予,身份受到保護。這個 Open Shell 正在全球範圍內被廣泛採用。Nvidia Open Shell 是開源的,你將看到非常多公司採用它——Red Hat、Canonical、微軟,它將在各處被採用。

這就是運行時。這個運行時完全針對 Nvidia AI 平台進行了優化,而 Nvidia AI 平台無處不在。所以你可以在任何雲、本地部署乃至設備端運行 Open Shell。

於是你有了智能體可以使用的工具和庫,有了可以修改或直接使用的模型,還有了智能體本身——OpenClaw、Hermes,另一個出色的框架。這些 Agentic 框架現在可以在本地部署或在任何地方運行。

好——四樣東西。而這代表了現代企業的操作系統。

Cadence×Nvidia芯片設計超級智能體:

驗證周期提速40倍以上,重新定義芯片工程

那我們如何使用它?我最喜歡的智能體應用場景之一就是芯片設計——那是 Nvidia 做的最重要的事情。

所以我們當然要與 Cadence 合作,構建超級智能體——芯片設計超級智能體。它由 Codex 或 Claude Code 協調,以 RTL、架構圖、原理圖或規格書作為輸入,以及任何需要修復的內容。

我們共同創建了一些針對 Nemotron 優化的超級智能體,運行在 Nvidia 運行時上。我們來看看——真的令人難以置信。

圖片

【產品介紹視頻】— Cadence × Nvidia 芯片設計智能體

「Cadence 與 Nvidia 正在合作構建芯片設計智能體。

數十萬顆 Nvidia 芯片匯聚在一起,組成了驅動全球前沿 AI 模型的 AI 工廠。

設計這些芯片及其運行的系統,是最艱難的工程挑戰之一。數萬億個晶體管,三維電路,微米級別,每一個門電路、每一根導線都必須精確到皮秒——在毫無誤差的條件下完美協作。物理原型太慢也太昂貴,工程師們在數字世界中作業。

每顆芯片始於一套架構規格,然後被翻譯成 RTL——芯片設計的語言。RTL 必須通過仿真驗證,一個 bug 就可能讓芯片延期數月。

在 Nvidia:數千名工程師,每年數十億計算小時,數百萬個測試被編寫、運行和調試——這個循環往往讓團隊耗費數周。

為了壓縮這個循環,Cadence 與 Nvidia 共同構建了一個設計驗證智能體。Codex 負責協調整個流程。Cadence Chipstack 啓動 RTL 驗證循環,由 Nemotron 驅動、Nvidia Open Shell 保護——調用 RTL 生成、測試台創建、迴歸測試和調試等方面的專家子智能體。

系統自主驅動。Chipstack 智能體用 Cadence Xcelium 運行數百次仿真,用 Jasper 進行形式驗證,設計缺陷被揭露、代碼中的 bug 被修復。曾經需要數周的工作,如今只需數小時。驗證周期——提速 40 倍以上。"

圖片

Nvidia 與 Cadence 攜手,用 AI 智能體重新發明了芯片設計——從數周縮短到數小時。

Nvidia 有數千名芯片設計師。我們要僱用數十萬個 Cadence 超級智能體與我們共事——讓我們能夠加速公司的節奏,讓我們更有雄心,創造更精彩的事物,跑得更快。

圖片

你們剛纔看到,這個工具包——模型、框架、工具(在這裏是 Cadence 的仿真器、驗證工具、形式驗證系統)——這就是為什麼我們如此努力地與 Cadence 合作,加速他們所有工具在 CUDA 上的速度。

因為智能體沒有耐心。智能體要立即得到答案。所以,模型、框架、加速的 CUDA 庫與工具,以及運行時——你們剛纔看到的,正是這一切匯聚的成果。

推出下一代高智能開放模型Nemotron 3

Ultra,5倍速度+30%更低成本,全面開

放,助力專屬超級智能體

這一切始於一個出色的模型——Cadence 可以修改和調優它,使其成為 Cadence 工作流、Cadence 專業知識方面的專家,從而創造出具有 Cadence 專有知識產權的超級智能體。他們需要從一個出色的模型起步。我們稱之為 Nemotron。

Nvidia 致力於為世界構建開放模型,讓你們所有人、讓我們所有人都能創建自己的智能體。

今天,我們宣佈推出 Nemotron 3 Ultra——我們的下一個開放模型。而且它非常智能。

Nemotron 模型不只給你模型本身,我們還把訓練該模型所用的全部數據一併開放。而且,由於我們擁有一個由出色合作伙伴組成的聯盟——你們可以看到所有合作伙伴——我們一起合作、相互貢獻數據。

Nemotron 是在全球規模最大的長程推理、長程工具使用、任務解決、工具調用數據集之一上訓練的,正是因為我們所有出色的合作關係。所有這一切——模型、訓練腳本和數據——全部向你們完全開放。

這是開放模型的最佳典範,是全球最優秀的開放模型體系。簡單的目標:讓你們能拿走所有這一切,在其基礎上添磚加瓦,讓它變得更好,讓它成為你們自己的。

Nemotron 3 Ultra 速度快了五倍。這是全球第一個基於 SSM(狀態空間模型)與混合專家模型混合架構的模型。這種架構極其快速。我們讓它快,是為了讓你能快速思考。快速思考,意味着相同成本下可以思考更長時間。

所以速度快了五倍。成本也低了 30%——與全球最具成本效益的模型相比,總 FLOP 數和總推理時間低了 30%。我們在與全球最好的開放模型進行比較,前沿級別的智能,快五倍,便宜 30%,完全開放。我們對此完全投入。

這就是 Nemotron 3。我們目前正在研發 Nemotron 4。

Vera Rubin全面量產,Vera CPU專為

智能體時代設計,Nvidia Agentic企業

AI工具包賦能每一家企業構建智能體

這整個工具包——模型、框架、工具與技能、運行時——是全球每一家企業現在都有能力創建自己智能體的原因,就像 Cadence 用他們的超級智能體做到的那樣。

我們正在與如此之多的公司合作——Cadence、CrowdStrike、TheSoul、Palantir、SAP 和 ServiceNow。

人們總是說:"Jensen,智能體會顛覆這些市場。"

我說:恰恰相反。而你們現在可以看到了。智能體將為我的合作伙伴和朋友們創造有史以來最大的機遇。我們有 Nvidia Agentic 企業 AI 工具包來幫助他們。

所以:

  1. Vera Rubin 全面量產。

  2. Vera CPU——為新一代、為智能體而生。

  3. Nvidia 企業 AI 工具包——讓每一家企業和每一家企業軟件公司都能構建智能體。


宣佈微軟與Nvidia的重大合作,重新定義PC

的操作系統架構:舊OS+LLM=新操作系統,

應用程序將被Agentic運行時取代


我和你們的淵源始於此地,你們中的很多人——很多我在台灣的朋友和合作伙伴——你們的公司也始於此地。這在很多意義上,是現代計算機產業的起點。

四十年了。它已經 33 歲。那時,PC 產業啱啱開始騰飛:Windows 1、Windows 2、Apple 1、Apple 2。等我們來的時候,Windows 3.1 就是 PC。如你們所知,Windows 95 讓 PC 變得"個人"了——它把 PC 從企業和公司帶到了消費電子設備的層面。每個人都應該擁有一台,而現在每個人都有了。

這就是起點。這個計算平台做了幾件極其聰明的事情。Windows 不只是去中心化的,如你們所知——Windows 是被恰當地抽象化的,被設計得恰到好處。系統總線,開放的芯片組。操作系統帶有可以在運行時連接和安裝的驅動程序。以及一個多媒體 API 抽象層,讓 PC 向我們今天所知的樣子開放。這些要素中的每一個,都是讓 PC 如此普及的必要條件。

40 年後,微軟和 Nvidia 將要重新發明 PC。這將是新的 PC。明天晚上——我想我們時區是明天晚上——我將與 Satya 一起出現。我們將更多地談論過去三年來微軟與 Nvidia 共同完成的工作。

圖片

花了這麼長時間,徹底重新發明 PC 的工作方式,才讓我們準備好迎接這一刻。就像我之前提到的,那個叫做"智能體"的計算模式——它將在 AI 雲中運行,在企業內部運行,也將在你的 PC 上運行。

當那台 PC 擁有了一個自主智能體——一個幫助你、理解你的智能體——會發生什麼?你可以跟它說話,它可以看到你,你可以讓它讀文件、去幫你做研究,它能做的還遠不止這些——我來展示給你們看。

新的操作系統,當然是舊的操作系統加上大語言模型——在很多方面,它是現代版本的 DirectX。它有輸入輸出,能理解提示詞,能理解計算機視覺,能生成視頻,能生成聲音。它是 PC 的現代延伸,是智能延伸。在此之上,應用程序——就像我之前提到的——將被 Agentic 運行時所取代,那纔是現代應用程序,是智能體。

現在來看看它能做什麼。

圖片

【產品介紹視頻】— RTX Spark 與 N1X 芯片

「一切始於一個靈感——一個重新構想 PC 的想法,這是 40 年來的第一次,為 AI 時代而生。

在智能體原生運行的世界裏,我們的個人電腦會變成什麼?連接本地或雲端模型。個人 AI 在沙箱中保障安全。持續運行,完成工作。芯片和操作系統都必須進化。

圖片

隆重推出 RTX Spark——我們 33 年學習積累的精華,凝聚於一顆芯片。Blackwell RTX GPU,6144 個 CUDA 核心。一 PetaFlop 的 AI 算力。與聯發科聯合開發的定製 20 核 Grace CPU,通過 NVLink 融合。128 GB 統一內存。台積電 3 納米制程。700 億個晶體管。以及與微軟的深度合作——一個面向智能體的 Windows 平台。

我們正在重新發明個人電腦——為創作,為遊戲,為智能體。這是新一輪個人計算革命的黎明。一切從 Nvidia RTX Spark 開始。」

圖片

就是它。當然,我必須向你們展示最美的部分——電子遊戲。這也是最貼近我們內心的。這是《Forza》賽車。這是新的《雙面特工 007》遊戲,順便說一句,我很期待玩它。我看起來有點像他。

圖片

女士們先生們,Nvidia RTX Spark 筆記本電腦。

RTX Spark讓開發者、創作者和普通用戶

都能在個人電腦上運行強大智能體,標誌

着PC進入全新「智能體輔助計算」時代

好了,這是全世界有史以來製造出的最令人驚歎的芯片。這是我們與聯發科聯合開發的 N1X。我想我之前見到了 Rick——這就是 N1X。

這是一顆美麗的芯片。這顆芯片,坦率地說,需要 33 年才能構建出來。原因在於,Nvidia 軟件棧的 100% 都可以在這上面運行。想做數字生物學——沒問題。想做地震處理——沒問題。想做天體物理學——沒問題。一切與 CUDA 相關的:所有物理、所有生物學、所有基因組學、所有 AI——沒問題。所有計算機圖形學——沒問題。

Nvidia 有史以來創建的每一個應用程序,以及 Windows 有史以來運行的每一個應用程序——微軟和 Nvidia 精心優化了所有這一切,使這台電腦字面意義上運行人類有史以來創造的所有東西。而且,它現在還能運行智能體。一台令人難以置信的電腦。我為此感到無比自豪。

好了,現在請記住這一點。在下一個視頻裏,我只是想向你們展示——想象一下,這裏展示的所有內容都將在你的 PC 上運行。

那台電腦可以有一個本地運行的 Nemotron 3 Ultra,或 Nemotron 3 超級模型,或者可以使用雲端的 Claude Code 或 Codex,或其他某個雲端模型——然後它將完成一些令人驚歎的事情。

我們來播放視頻。

圖片

【產品介紹視頻】— 在 RTX Spark 上運行智能體輔助建築設計

「每棟房子都始於一個構想。從構想到設計,需要大量的工具、專業知識和時間。

現在,一個在 RTX Spark 上本地運行的智能體,可以幫助我在筆記本電腦的工具上設計一棟房子。

在 Open Shell 沙箱中運行 Hermes 框架,連接到雲端的 Claude Sonnet——我選定地塊,分享我的概念草圖和風格情緒板來激發設計靈感,並輸入提示詞:一段描述需求和設計意圖的文字。

我的智能體開始工作,使用我筆記本上的工具。它打開 Rhino,開始建模地塊——塑造地形、退線和建築體量包絡線。然後它提出針對成本、舒適度和品質優化的建築形態方案。

確定形態後,我的智能體生成室內佈局——牆體、流線、房間開始成形。我可以隨時介入調整,門窗和結構構件自動就位。我的智能體會自己發現錯誤並修正。

經我確認後,智能體將模型從 Rhino 導出到 Blender,材質和對象屬性連同設計上下文一併遷移。我微調材質,調到滿意的效果,然後選取鏡頭。Blender 渲染房屋,我的智能體使用 Flux 2 模型的生成 AI 將渲染圖做成照片級真實效果。多個視角,多種光線條件。

曾經複雜的工作流,現在由我在 RTX Spark 上運行的智能體引導和簡化。以想象的速度完成設計。」

你看——在智能體的世界裏,開發者們對此興奮無比。這是一台令人難以置信的電腦,擁有所有的加速能力和軟件能力,與每一位開發者合作,讓它對你們所有人來說都極為出色。

下一個——Adobe 出色的創意套件,當然已被全球數千萬人使用。他們重新設計了 Adobe Photoshop 和 Premiere 的架構和核心,並將為 RTX Spark 發布新版本。速度快了兩倍。本來就已經很快了——現在要快兩倍。而且它還被設計成對智能體友好的——通過 MCP 服務器,它現在可以與你筆記本上的智能體交互。

有那麼多合作伙伴對把 RTX Spark 推向市場充滿熱情,令人難以置信。這是 40 年來首次覆蓋整個 PC 產品線的重新發明。

我非常高興全球的你們和整個生態系統加入了我們。這基本上是全行業都在支持 RTX Spark,我們將與所有人共同構建出極其智能、強大而美麗的筆記本電腦。非常感謝大家。

PC將像當年的手機一樣被徹底再發明

未來每棟房子都可能擁有一台AI超級

計算機,全天候運行個人智能體


但這還不是全部。RTX Spark 重新發明了筆記本電腦。但事實上,微軟和 Nvidia 正在重新發明整個 PC 產品線。


今天,我們宣佈推出全新的三款革命性 Windows 機器,涵蓋台式機、筆記本電腦和工作站。全部 100% 兼容 Windows。100% CUDA。100% Nvidia AI 張量核心。

全球在所有這些不同平台上在 Nvidia 上運行的一切,在這裏也都能運行。這是 40 年來發生的第一次徹底重新設計和重新發明的 PC 產品線。

讓人真正驚歎的是這個。這是 RTX Spark 筆記本,這是來自 MSI 的台式機。看看它有多美。

這個智能體可以 24/7 全天候免費運行——你好,你的智能體。你可以在這裏運行它。這是你的時鐘,它一直在運行,沒有計費計時器。連接到你的整個家——連接到你的筆記本、顯示器、所有攝像頭、烘乾機、飲水機、熱水器,你的一切——只要你想要,你的安全系統——全都連接上。這就成為你的私人 AI 智能體。

它會隨着時間越來越聰明,因為今天我們有 Nemotron 3 Ultra,明天有 Nemotron 4,然後是 5、6……我們就這樣不斷變得越來越聰明。與此同時,它坐在家裏幫你做事。如果你想訂行程——沒問題。

如果你想要一台令人難以置信的系統,這是 DGX Station 4——與 Windows 完全兼容,運行 Windows 下的所有東西——它有 768 GB 內存,你可以運行一個萬億參數的模型。這令人難以置信,20 PetaFlops,8 TB/s 的內存帶寬。

這就放在你的桌邊。如果你是大語言模型的開發者,如果你是智能體的開發者——有這個放在桌邊,你就擁有了所需的全部算力。然後當你部署時,再放到雲端去。

現在,如果你看着這個並思考一下,會發現某些事情正在發生。記得 15 到 20 年前,我們有一個叫做"手機"的概念,今天我們有一個叫做"PC"的概念。

而今天,當你想到你的手機時,你唯一不用它來做的事情就是打電話。你用它做幾乎所有其他事情。所以那部"手機"對你的意義,和過去的手機根本不同。

圖片

我非常確信,將要發生的事情是:十年後的 PC,和你今天認為的那台工具——你在上面打開應用程序,點擊和打字——將會完全不同。

這是我的理論。我完全可以想象,就像今天每棟房子都有家庭影院——很多房子有大屏電視、割草機、洗碗機——我完全可以想象,有一天每棟房子裏都會有一台 AI 超級計算機。它運行你所有的智能體,運行你所有的助手,全天候為你做各種各樣的事情。就像你家有家庭影院、有立體聲音響、有遊戲機一樣——你的家裏會有 AI 智能體計算機在運行。

而它,假以時日,在你心目中會越來越像 R2-D2,越來越像 C-3PO,而不再像一台 PC。

毫無疑問,這次計算機的再發明,與智能手機對手機的再發明一樣意義深遠。這就是這段旅程的起點。

這是一個新產品線的開始。我們有這方面的路線圖——這對我們來說是全新的產品家族。每一代架構,我們都會有台式機、筆記本電腦和工作站。

讓我感到無比欣慰和無比榮幸的是,全球 100% 的 PC 行業都加入了我們,共同重新發明 PC。新產品線,新起點。謝謝大家。


發布Cosmos 3模型、Alpha Mayo 2模型;AI的下一個飛躍是通用人形機器人,Isaac Groot旨在成為機器人領域的「參考平台」

發布Cosmos 3,物理AI的前沿開放全能

模型,採用全新混合Transformer架構,

擁有VLM、世界模型、仿真器等多重能力


如你們所知,Agentic AI 就是一個數字機器人——它理解、推理、規劃、行動並使用工具。Agentic AI 將在所有這些計算機上運行。你們已經看我談論過其中的每一種。


隨着時間推移,我們在做各種各樣的人形機器人計算機,做自動駕駛汽車計算機,做衛星相關工作。你們有搭載張量核心的 GForce,我啱啱談了全新的 PC 產品線。


農業設備、製造設備、重工業設備——都將是 Agentic 的。你甚至會有一個小型 Agentic 助手為你自己服務。即使是基站——未來的無線電台也將是 Agentic 的:理解流量、思考如何與其他基站協調,以儘可能少地使用能源,提升利用率、提升頻譜效率。一切都將運行智能體。


今天,Nvidia 很大程度上處於中心位置。但我非常確信,將會有數百億——隨着時間推移達到數千億個——Agentic 系統、Agentic 計算機在全世界運行。

最大的問題是數據。對於語言模型來說,互聯網上的所有英語和所有語言——我們訓練用的數據——都是從我們人類的視角出發的:是我們寫下的,是我們閱讀的。

然而,為 AI 機器人創造訓練數據,必須從機器人的感知視角出發。而世界上大多數視頻數據是第三人稱的,不是第一人稱的。所以,對於 Agentic 系統、機器人系統、物理 AI 來說,數據是最難的問題。

你們看到我們沿着這條路走來。我們從遙操作開始——本質上是人類示範。這和強化學習人類反饋的重大突破沒有什麼不同。然後我們使用仿真。

這就是 Omniverse 的用武之地——這和使用可驗證獎勵的強化學習沒有什麼不同。於是我們用這些系統來引導、啓動 AI 模型,即物理 AI 模型。最終,我們能夠從第三人稱視頻中學習,重投影為第一人稱。

而現在,通過一步步的引導,我們有了一個世界基礎模型,它能夠從你想要的任何視角理解物理世界——第三人稱、第一人稱、由外而內、由內而外,都沒關係。這確實是一個重大突破。

今天,我們宣佈推出 Cosmos 3——物理 AI 的前沿。在語言模型領域,我們處於前沿,而且有那麼多人在從事這方面的工作。然而,在物理 AI 領域,我們絕對是全球最好的。我為團隊完成這件事感到無比自豪。這是你們所有工作的基礎模型。

無論你想創造什麼樣的機器人——工廠機器人,在工廠裏工作的機器人,任何涉及物理世界的機器人——你現在都有了一個夥伴 Cosmos 3,它能理解和推理,能夠生成,能在循環中仿真,甚至可以本身就是策略。它在全球各地的排行榜上位居榜首。我為 Cosmos 感到無比自豪。

今天,我們宣佈推出 Cosmos 3。我們來看看。

圖片

【產品介紹視頻】— Cosmos 3:物理 AI 基礎模型

「真實世界是無限且不可預測的。物理 AI 需要數據,但真實世界的數據無法大規模獲取。對於物理 AI,算力就是數據。

這就是 Cosmos——一個面向物理 AI 的開放前沿全能模型(Omni Model)。基於全新的混合 Transformer 架構構建。像素、動作、聲音和語言流入自迴歸 Transformer,它負責推理、規劃並指揮擴散 Transformer,後者生成接下來將發生的事情。

開發者可以在不同實體形態和應用場景上對 Cosmos 進行後訓練。

作為 VLM,Cosmos 觀察物理世界,理解正在發生的事情,描述場景並標記關鍵內容。

作為世界模型,Cosmos 從圖像、文本或視頻生成物理精確的合成視頻。

作為仿真器,Cosmos 為策略訓練和評估閉合循環。

而作為 Nvidia Omniverse Dreams 的基礎——一個動作條件世界模型——Cosmos 逐幀預測未來。對 Cosmos 進行後訓練,它就成為了世界行動模型:感知、推理、規劃,為各類機器人、為一切運動的事物生成行動。

一種新的數據,一種新的教師,由算力生成。Cosmos——物理 AI 時代開發者的基礎。」

數據加算力得到 AI。現在我們有了 AI,算力就是數據。所以用 Cosmos 來訓練大量的 AI 模型。

Cosmos 是一個如此出色的開放模型體系——與 Nemotron 完全一樣:我們開放模型,開放數據,我們甚至開放了我們如何訓練它,這樣你就可以對其進行增強,並把 Cosmos 變成你的專有模型。

我們在如此多的不同行業都有出色的合作伙伴與我們共同工作。

推出面向自動駕駛的開放模型Alpha

Mayo 2,Nvidia Hyperion已簽約

品牌覆蓋全球約80%的汽車產量

當然,模型本身是 AI 技術棧中最容易理解的部分。但 AI 技術棧非常複雜——它有生成器、模型、仿真器和運行時,就像 Agentic 系統一樣。

這些汽車本質上就是物理 AI——一輛作為自主駕駛車輛的 Agentic 機器人,同樣擁有這個複雜的技術棧。

今天,我們宣佈推出 Alpha Mayo 2——一個面向自動駕駛汽車的開放模型。

我們正在與全球各地的汽車公司合作。如果你看看這些已經簽約 Nvidia Hyperion 的品牌——正在製造 Nvidia Hyperion 汽車的品牌——這代表了全球約 80% 的汽車。這些製造商代表了全球 80% 的汽車產量。我們將擁有大量能夠運行 Alpha Mil 或任何其他人自動駕駛技術棧的 Nvidia Hyperion 系統。

我們還連接到了出行服務。全球約 97% 的出行服務正在與我們接入合作。所以,當我們在 Hyperion 運行時和 HALOS 操作系統上部署 Alpha Mayo,我們將能夠連接到全球所有這些服務。

我們來看看這個。

【產品介紹視頻】— Alpha Mayo 2:自動駕駛演示

圖片

【一輛梅賽德斯車輛在城市環境中行駛,AI 實時播報其推理過程】

「正在規劃前往目的地的路線。車道暢通。

拉出停車位開始行駛。

由於前方停止的車輛阻擋我們的車道,向左微調。

減速在十字路口控制方向的停車標誌前停車。

停車讓行人通過。由於有人在我們車道上,讓行從左側切入的車輛。

向左微調,避開右側阻擋的停止車輛。

與切入車輛保持距離,因其正在併入我們的車道。

由於停止的貨車和額外的行人橫穿我的車道,向左微調。

前方有人行橫道——停車與前車保持距離。與正前方車輛保持距離。

在停車標誌處停車,因為這是有管控的路口。

停車讓行,因有騎行者正在穿越。與前車保持距離。

由於卡車阻擋在我車道左側——向右微調。您的目的地在右側。"

Alpha Mayo——全球第一輛推理型自動駕駛汽車。如果你讓它一直說話,它會讓你抓狂。但我們非常高興它一直在自言自語——那叫做思考。Alpha Mayo 就是一個推理型 AI。

AI的下一個飛躍是通用人形機器人,

Isaac Groot旨在成為機器人領域的

「參考平台」

我們創造的這些技術也同樣適用於人形機器人。當然,還有許多新的突破需要實現。

Nvidia Isaac Groot 是我們的人形機器人技術棧——數據生成、仿真、運行時,包括 AGR 系統。

無論是 Agentic 系統——雲端的 Agentic 系統,PC 上的,自動駕駛汽車的機器人系統,人形機器人的機器人系統——計算模式完全相同。

而且在每一種情況下,我們都從垂直整合、完全集成的協同設計、極致協同設計着手,然後向所有人開放,讓你使用你喜歡的任何部分,無論你想用什麼——我們甚至幫你進行修改。

但缺少的一件事是:我們需要機器人系統的參考平台。這些機器人系統極其複雜——電機那麼多,傳感器那麼多,如此脆弱。但我們需要有一種方式來交付這些參考平台,就像我們為 PC、DGX、雲計算和自動駕駛汽車所做的那樣。現在,我們要為機器人做到這一點。

今天,我們宣佈推出 Nvidia Isaac Groot——一款參考人形機器人,完全集成。每隻手 25 個自由度,由 Schaeffler 製造,整個機器人 31 個自由度,身高 6 英尺,體重 150 磅——和我一樣。第一個數字比我短,第二個數字比我大,其他方面都差不多。

這款平台搭載全新的 Thor 處理器和我們的整個軟件棧:數據生成棧、數據仿真棧、運行時——全部集成進一台專為所有人使用而設計的機器人。

我們為它而建的首批用戶是高等教育機構和大學研究人員,因為讓他們自己去構建這些是極其困難的事情。

我們來看看。

圖片

【產品介紹視頻】— Isaac Groot 人形機器人平台

"AI 的下一個飛躍是通用機器人——人形機器人。

但構建一個如此之難。每個團隊都從零開始,拼湊仿真器、遙操作系統、數據流水線和訓練基礎設施——在研究開始之前需要數月的搭建。

Nvidia Isaac Groot——一個面向人形機器人的開放開發平台。開放模型、仿真與訓練庫,以及數據生成器。加上機器人計算機——完整的流水線,數小時內即可就緒。

首先,在 Isaac Lab 中建立仿真環境。用 Isaac Teleop 在真實或仿真機器人上捕獲示範動作。用 Omniverse 和 Cosmos 生成合成數據,將一次示範擴展為數千次。訓練策略,在 Isaac Lab Arena 中評估。通過運行在 Jetson Thor 上的 Isaac Cross 進行部署。

每個元素都是模塊化的、開放的——使用我們的,或者換入你自己的 Groot。它正在驅動每個學科、每個領域的機器人研究——從研究實驗室到工廠車間。一個開放平台。

以及一個新的補充:Isaac Groot 參考設計機器人——構建於 Nvidia 開放平台之上,為任何地方的任何實驗室的前沿研究而生。機器人時代,從這裏開始。"

Nvidia Isaac Groot——如此之多的機器人。我們正在與全球幾乎所有從事機器人或機器人系統工作的人合作。

過去六個月,計算機產業因Agentic AI與前沿模型結合而徹底改變,Nvidia已轉型為AI基礎設施領導者,支持全場景智能體部署

圖片

讓我告訴你們我講述的這一切。

在過去六個月裏,計算機產業已經徹底改變。一切都因為智能體得到實現而改變——它與最新的前沿模型融合在一起,使得 AI 現在能夠做真正有用的工作。

這個計算模式將一遍又一遍地重複——這個智能體的計算模式:模型,使用帶有技能的工具的框架,在運行時中運行。那個運行時取決於它是在雲端還是本地部署,是在 PC 上還是在機器人上。

但對於所有這些,計算模式完全相同。你會因為你的偏好而使用不同的框架,因為你的偏好而使用不同的模型,你會針對你的專有用途加以改進,你會創建超級智能體然後租給其他人,幫助他們完成工作。

這個 Agentic 平台,這個 Agentic 模式——Nvidia 有一套企業 AI 工具包。這是你們所有人與 AI 互動的絕佳方式。對我們來說,這是一個絕佳的增長機遇。

Vera Rubin 全面量產。Grace Blackwell 是為處理 AI——特別是推理——而創造的;Vera Rubin 是為運行智能體而創造的。它已經全面量產。它遠不只是一顆 GPU——它是一個完整的、去中心化的、分佈式的智能體處理系統。

Nvidia 真正已經成為了一家基礎設施公司。不只是 GPU 公司,不只是系統公司,而是一家基礎設施公司——幫助你們實現最大的營收、最大的利潤,並儘快到達那個目標。

智能體世界——這種全新的計算方式,你為智能體而非人類構建 CPU,為智能體而生的 CPU——有其特殊的需求。而我們的 Nvidia Vera 是革命性的。我對它的量產爬坡無比高興。訂單已經顯示,它將成為我們公司歷史上最快、最成功的產品發布。

Nvidia 和微軟共同創造了全新的 PC 產品線。這是一個新的起點。當然,我啱啱描述的這個 Agentic 處理模式、計算模式,也將在各種設備上運行。

我提到了 PC,但未來將會是機器人、衛星、基站、工廠——在雲端、在本地、在邊緣——這個 Agentic AI 系統、這個 Agentic 計算模式將在全世界的計算機中複製。我們對個人計算機的認知,很可能將會徹底改變。

我想感謝你們所有人的合作與友誼。沒有我們共同完成的一切,我們不可能走到今天。我為你們在過去這一年取得的巨大成功感到無比自豪。明年——將會更多。

我還有最後一件事要給你們看。我們來看看。

[結尾特別表演節目]

圖片

圖片

圖片

圖片

圖片

圖片

感謝這非凡的一年。感謝你們所有的友誼與支持。謝謝大家,保重,Computex 愉快!

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10