6月1日,英偉達創始人兼CEO黃仁勳在中國台北舉辦的GTC大會上發表主題演講。
黃仁勳宣佈,英偉達旗下最新數據中心CPU Vera進入量產、推出RTX Spark超級芯片正面進軍個人電腦市場,並在機器人和自動駕駛領域持續拓展生態邊界,進一步強化其在整個AI產業鏈中的核心地位。
數據中心CPU量產: 英偉達宣佈首款獨立數據中心CPU Vera正式進入量產,將於今年第三季度投產。
首批頂級客戶確認: OpenAI、Anthropic和SpaceX已確認成為Vera CPU的首批部署客戶。
正面硬剛傳統巨頭: Vera芯片性能達英特爾x86的1.8倍,直接對標英特爾、AMD及雲廠商自研芯片。
聯手聯發科重返PC市場: 英偉達聯手聯發科、台積電打造RTX Spark超級芯片,十年後再度殺回個人電腦處理器市場。
Windows陣營全面倒戈: RTX Spark採用Blackwell架構,今秋將隨戴爾、聯想、微軟等主流品牌高端機型同步上市。
垂直整合顛覆PC鏈: 英偉達效仿蘋果走SoC垂直整合路徑,黃仁勳稱其為「40年來首次重新定義PC」。
DSX平台大幅榨乾電力: 推出開源數據中心平台DSX,能讓運營商在同等電力預算下多部署40%的加速芯片。
聯手宇樹科技進軍人形機器人: 推出Isaac GR00T人形機器人蔘考平台,由中國宇樹科技H2機器人作為載體。
機器人研究正式「平權」: 該機器人平台支持開箱即用,旨在讓前沿機器人研究走出大廠、惠及高校學術機構。
智駕聯合中國車圈: 比亞迪、吉利、小米等中國主流車企已全面採用英偉達DRIVE Hyperion自動駕駛平台。
Vera芯片量產,OpenAI等率先採用
英偉達宣佈Vera Rubin架構已全面進入量產階段,Vera CPU將於今年第三季度正式投產,OpenAI、Anthropic和SpaceX將率先在其數據中心部署該芯片。
Vera是英偉達首款專門面向數據中心的獨立微處理器,直接對標英特爾Xeon系列、AMD Epyc系列,以及亞馬遜Graviton等雲廠商自研芯片。黃仁勳表示,Vera在AI核心工作負載上的性能是英特爾x86架構芯片的1.8倍——這也是英偉達首次就CPU性能與行業現行標準展開正面比較。
此舉背後有明確的戰略邏輯:隨着AI工作負載重心從模型訓練轉向推理與服務部署,通用CPU的地位日益凸顯,市場對英偉達GPU加速器是否仍不可或缺的疑慮也隨之上升。英偉達通過Vera表明,其希望在這一轉型中同樣佔據核心位置。黃仁勳一再強調,英偉達是唯一能夠為數據中心運營商提供全套所需組件的公司,且高度集成化的產品形態使客戶無需深厚技術積累即可快速部署。
進軍PC市場,RTX Spark正面挑戰英特爾
英偉達宣佈推出RTX Spark超級芯片,標誌着其正式進軍個人電腦處理器市場,計劃今年秋季率先在高端筆記本和台式機上亮相。
該芯片由英偉達與聯發科聯合開發,由台積電採用3N工藝代工,內置最多20個核心的CPU與6144個核心的Blackwell架構GPU,兩者共享內存,通過NVLink接口互聯,運行微軟Windows for Arm操作系統。參與推出首批產品的PC品牌包括戴爾、聯想、惠普、華碩、宏碁及微軟,初期定位高端市場,面向AI開發者、創作者和遊戲玩家。英偉達表示,後續將擴展至約30款筆記本和逾10款台式機,覆蓋更廣泛的價格區間,並將隨每代AI處理器同步推出新一代PC芯片。
黃仁勳稱,英偉達與微軟在這一項目上已合作三年。新芯片能夠在本地運行大型AI模型,並支持Adobe Photoshop等主流軟件的AI功能,黃仁勳將AI智能體描述為取代鼠標鍵盤、成為人機交互主要方式的核心技術。
分析人士指出,英偉達此舉走的是蘋果Apple Silicon的垂直整合路徑,將CPU、GPU與AI運算單元整合為單顆SoC,直接向整機廠商輸出完整計算平台,目標是整個Windows陣營,這將使英偉達在PC價值鏈中的地位發生根本性變化。儘管英偉達當前在數據中心的營收規模已大體相當於英特爾與AMD年銷售額之和,但其股價今年以來的表現仍落後於費城半導體指數,進軍PC市場或有助於向投資者展示其在AI普及終端這一趨勢中的佈局深度。
DSX平台:同等電力預算下多用40%加速芯片
英偉達推出數據中心軟件平台DSX,以開源模式向基礎設施運營商提供規劃、部署和監控的完整工具套件,用戶可按需選取所需組件。
據英偉達介紹,DSX的一項關鍵優勢在於大幅提升數據中心電力管理效率,使運營商在相同電力預算下可額外部署最多40%的英偉達加速芯片——對於受制於供電容量的大型數據中心而言,這一優勢尤為顯著。黃仁勳表示,藉助DSX,用戶可以在不花一分錢的情況下對整個工廠進行模擬,在安裝任何機架之前驗證性能。
英偉達還推出DGX Station for Windows高端工作站產品線,與戴爾等PC廠商合作,計劃於今年第四季度開始銷售,面向使用Windows系統開發和部署AI軟件的企業用戶。
人形機器人:攜手宇樹科技,開放學術研究市場
英偉達宣佈與中國機器人初創公司宇樹科技合作,推出面向高校及學術機構的Isaac GR00T人形機器人蔘考平台。
該系統以宇樹H2機器人為載體,整合了搭載Blackwell架構GPU的Jetson Thor計算模塊、GR00T軟件棧,以及由新加坡Sharpa公司製造的五指靈巧手,全身31個自由度,身高約6英尺、重150磅,支持開箱即用。英偉達表示,目前研究機構在使用機器人時需花費大量時間進行配置和調試,此平台旨在解決這一痛點,讓前沿機器人研究走出大型科技公司和AI獨角獸的圈子,惠及更廣泛的實驗室。Ai2(西雅圖)、蘇黎世聯邦理工學院(ETH Zurich)、斯坦福大學機器人中心及加州大學聖地亞哥分校高級機器人與控制實驗室已確認率先採用。
英偉達副總裁Rev Lebaredian表示,這是"將前沿人形機器人研究從全球最大科技公司和AI獨角獸手中解放出來,讓每個實驗室都能觸及"的舉措。
宇樹科技目前正尋求在上海科創板上市,擬募資42億元人民幣(約6.2億美元),該公司逾40%的營收已來自中國大陸以外市場。
自動駕駛:DRIVE Hyperion生態浮出水面
英偉達在發布會上進一步披露了DRIVE Hyperion自動駕駛平台的商業落地進展。
英偉達表示,比亞迪、吉利、極氪、小米以及小馬智行等中國主流車企和自動駕駛公司,均已採用或正在基於NVIDIA Hyperion平台開發智能駕駛系統。此外,英偉達專門針對自動駕駛出租車場景推出了Alpamayo 2超級開放推理模型,進一步擴展其在出行領域的軟件佈局。
以下為黃仁勳演講全文,由AI輔助翻譯:
見到大家真好,回家的感覺真好。我把父母帶回了家鄉,爸媽在哪裏?請大家為我的父母鼓掌,也為我們開場環節的明星嘉賓鼓掌。女士們先生們,他們太可愛了,是中國台灣的明星!
今天到場的人非常多,本次演講正同步直播給中國台灣各地 70 個線下觀看點,70 場分會場同步進行,所有人都在收看這場主題演講。我們有大量內容要分享,也有衆多合作伙伴需要感謝。英偉達在中國台灣的生態系統規模之大,令人難以置信。
大多數人提到生態系統,首先會想到我們的軟件棧,以及英偉達計算平台之上的開發者生態。但英偉達的生態覆蓋上遊中國台灣供應鏈(一切的起點),一直延伸到下游的數據中心,最終觸達終端用戶。今天我們會講解幾乎整個生態體系。這裏匯聚了衆多企業,還有我最珍視的生態合作伙伴。
中國台灣擁有全球最豐富、最頂尖的供應鏈生態,這一點令人驚歎。感謝各位蒞臨,今年我們的業務共同實現了迅猛增長。昨晚我得知,中國台灣年度 GDP 增速將接近 10%,這一數據十分驚人。
話不多說,我們正式開始。兩年前我在這裏就提到,AI 正從生成式 AI 邁向全新浪潮,下一波 AI 就是智能體 AI。如今我們可以明確:智能體 AI 已經到來,實用型 AI 正式落地。
一、實用型 AI 到來,智能體重構計算模式
GitHub 是智能體 AI 最早的落地場景之一 —— 軟件編碼。軟件開發是全球最具價值的職業之一,擁有龐大生態:全球約 3000 萬至 4000 萬專業軟件開發人員,另有數百萬學生與愛好者。
GitHub 的代碼提交數據清晰印證變化:2023 年 3 億次,2024 年 4 億次,2025 年 5 億次;2026 年前幾個月,提交量幾乎翻了三倍。
這背後的經濟價值十分顯著:全球 3000 萬至 4000 萬軟件開發者,每年創造約 3 萬億美元薪資價值,驅動全球百萬億級產業增長。如今同等人力投入,產出接近三倍,相當於 3 萬億美元薪資創造了 9 萬億美元生產力,差距極為驚人。這就是 AI 的潛力與價值。
軟件工程師的數量正在持續增加。所謂 「AI 會減少就業」 的說法完全是無稽之談,AI 反而推動企業招聘更多軟件工程師。原因很簡單:軟件工程師的產出價值大幅提升,企業自然會擴大招聘,這一變化很快會體現在經濟數據中。
從行業視角來看,實用型 AI 的落地讓Token 需求爆發式增長,Token 成為可盈利的收入單元。AI 企業加速生產 Token、搭建更多 AI 工廠,這正是中國台灣算力需求飆升的核心原因,也是各位業務蓬勃發展的關鍵。
這背後是全新的計算模式:不再是單一大語言模型,而是智能體。今天我們所有的分享,都基於這一核心。
什麼是智能體
傳統計算是「應用程序 + 代碼 + 操作系統」,應用代碼在操作系統內運行。
如今的智能體,由一個或多個大語言模型與調度框架組成,框架負責協調智能體完成高效工作。
智能體接收輸入後,會完成理解、觀察、推理、執行、調用工具,工具可包括電子表格、網頁瀏覽器、數據處理引擎、數據庫引擎等。信息路由、上下文處理、環境理解、推理規劃、執行動作,全程由軟件統一調度。
智能體和人類一樣,擁有工作記憶(短期記憶)與長期記憶,內存管理系統至關重要。整套系統即為智能體:大語言模型負責思考,調度框架像操作系統一樣連接所有組件,這就是全新的計算模型。
大語言模型的思考、推理、規劃、工具調用能力,搭配管理內存、調度、工具使用的框架,讓智能體能夠完成各類複雜任務。
智能體應用案例
輸入指令,AI 直接生成對應代碼;
輸入需求:製作 GIF 動畫,黑色背景上英偉達綠色點陣匯聚成台北 101 大樓,呈現 GTC Taipei 2026 元素,再散開形成英偉達 logo,循環播放,AI 直接完成生成;
輸入需求:遙控器電池夾丟失,根據外觀創建可用於 3D 打印的 CAD 文件,AI 調用工具直接完成。
這就是未來的計算方式:不再是啓動應用、點擊輸入,而是向 AI 說明需求與意圖,AI 生成代碼或調用工具,直接輸出所需結果。這就是智能體 AI,我們籌備兩年,如今終於落地。
智能體 AI 的重大突破之一是工具使用。很多人認為智能體 AI 會讓軟件公司消亡,事實恰恰相反。智能體數量將爆發式增長,世界不再受人力數量限制,智能體對工具的需求會遠超以往。
當下正是軟件企業的黃金時代,關鍵是把軟件以智能體可調用的形式呈現,這是行業重大突破。
英偉達的核心寶藏是CUDA X 庫。二十年前我們打造了 CUDA 統一加速計算架構,如今擁有 1000 個 CUDA X 庫,助力開發者在科學與工程各領域實現突破。這些庫都是智能體的高效工具:
cuLitho:計算光刻
cuOpt:決策優化
cuDSS:直接稀疏求解器
AIQ:結構化與非結構化文檔深度研究
Ariel:AI 相關
ran warp:可微物理
Parabrick:基因組學
這些庫的核心是算法,極具價值。
二、智能體計算:分佈式異構計算新範式
智能體是終極解耦式分佈式計算模型,處理任務時會調動多類計算資源。智能體由模型、調度框架、工具技能、運行環境組成,分別在數據中心不同位置運行:
模型:大腦
調度框架:身體
工具 + 運行環境:工作車間
每一次思考、上下文處理、環境理解、推理規劃、執行動作,都會激活一整櫃 Grace Blackwell NV Link 72;調用工具時則使用 CPU,工具可兼容 C 編譯器、Python、JavaScript 或加速計算。
當前智能體調用工具的方式相對基礎,未來會高度成熟,CUDA X 庫將成為智能體的核心工具,解決全球關鍵問題。我們會為 CUDA X 庫配套 AI 可學習的使用技能,讓智能體高效調用。
工具運行在 CPU、GPU、大語言模型上;安全調度框架運行在 CPU 與英偉達 BlueField DPU 上;整體調度由 CPU 負責。
內存是最大難點:工作記憶(KV 緩存)的存儲、壓縮、檢索,結構化 / 非結構化數據調取,數據間的關聯關係,處理邏輯極為複雜。AI 的內存系統將徹底革新存儲體系。
這種分佈式、異構的計算模式,和傳統「軟件打包在操作系統內運行」完全不同,這也是我們研發下一代產品的核心原因。
三、Vera Rubin:為智能體時代打造的終極系統
Vera Rubin 並非單一芯片,也不只是 GPU,而是端到端完整系統,包含 GPU、NV Link 72,由 Vera CPU 統一調度。
其配套革命性存儲系統、CX9 與 DOCA 軟件棧,內置安全處理器,實現數據靜態、傳輸、使用全流程加密,滿足機密計算要求 ——AI 模型價值極高,安全至關重要。
Vera Rubin 是英偉達歷史上最具雄心的項目,全公司 4 萬名工程師全員參與,合作伙伴也深度貢獻,堪稱行業奇蹟。
英偉達早已從 GPU 公司轉型為系統公司,Vera Rubin 是有史以來設計最複雜、底層架構最完整的系統。我們的客戶最終需求不是購買計算機,而是搭建 AI 工廠,因此英偉達再次轉型,成為基礎設施級技術提供商。
全球正掀起 AI 工廠建設熱潮,這是人類歷史上最大規模的基礎設施建設。AI 工廠複雜度極高,芯片、機櫃、網絡、電力、冷卻、電網必須端到端協同設計,因為算力就是收入。
英偉達 DSX:AI 工廠最優設計藍圖
DSX 是搭建、運營高效盈利 AI 工廠的參考設計:
藉助 DSX SIM Omniverse 藍圖,合作伙伴可在物理部署前,完成佈局規劃、電力冷卻模擬、網絡設計、集成驗證、變更測試;
工廠上電後,DSX OS 負責配置、運營、監控、修復,將硬件轉化為可信、多租戶、高彈性的 AI 算力;
現有 AI 工廠電力超配高達 40%,DSX Max Lps 可在同等預算下安全部署更多 GPU,每年新增數十億美元收入;
45℃高溫液冷技術,降低水耗與能耗,讓更多電力用於產生收益的算力;
動態電力分配、電力平滑技術,優化工廠電力使用;
AI 智能體與 DSX Max Lps 協同,平衡冷卻與電力;
DSX Flex 可讀取電網實時信號,動態調整工廠電力,讓 AI 工廠成為靈活的能源資產。
到本世紀末,將有 100 吉瓦的 AI 工廠上線,英偉達 DSX 能實現最高效率、最低 Token 成本,同時強化電網穩定性。
這是 AI 工廠生態,上游是中國台灣供應鏈夥伴,下游是 AI 工廠客戶。英偉達不只是研發 GPU、打造系統,更是助力客戶搭建複雜度極高的 AI 基礎設施。
單吉瓦級 AI 工廠的投入,已從 200-300 億美元升至 500-600 億美元,很快將達到 800-1000 億美元。如此高的資本與複雜度,必須一次成功、立即上線。
如今我們通過 Omniverse 數字孿生,在虛擬世界完成巨型系統的設計模擬,再落地實體建設,大幅降低風險與成本。
英偉達產品體系清晰:RTX 面向 GPU、DGX 面向系統、DSX 面向基礎設施。憑藉全棧技術能力,我們助力小型企業成長為世界級 AI 雲服務商,例如 Core Weave、Nebius 等,服務客戶包括 Cursor、Black Mountain Labs、Revolute、Shopify、英國電信、谷歌、Naver Cloud、韓國銀行、現代、AI Singapore、中國台灣 GMI 等。
AI 將無處不在,每家企業都會被 AI 驅動,每個地區都會建設 AI 基礎設施。
算力即收入,算力即利潤
AI 基礎設施的上線速度、吞吐量、可靠性、使用周期,直接決定收益。單吉瓦電力是固定上限,每瓦吞吐量就是收入,每個 Token 都能創造盈利。
選擇錯誤的架構,即便芯片單價更低,也無法實現高效收益。英偉達全棧整合、底層設計、系統模擬、極致架構優化,讓我們實現:
最快的首 Token 產出、首推理、訓練啓動速度;
全球頂尖的每瓦吞吐量、Token 產出效率;
大規模運營積累的高可靠性,故障間隔極長;
超長的系統使用周期,軟件持續迭代兼容,總擁有成本(TCO)更低。
這就是「算力投入越多,收益越高」的核心邏輯。
各位都在親身感受這一趨勢:中國台灣全產業鏈工廠高速運轉,因為實用型、盈利型 AI 已到來,算力需求成為核心約束,我們需要全力助力全球搭建 AI 工廠。
Vera Rubin 已全面量產,其供應鏈規模是 Grace Blackwell 的兩倍;單台 Grace Blackwell 機櫃組裝時間從 2 小時縮短至 5 分鐘,產能與效率大幅提升,數百萬平方英尺的廠房已投入支持,全力擴產 Vera Rubin。感謝所有合作伙伴。
Vera Rubin 是為智能體 AI打造的多機櫃集群級系統,專為處理觀察、推理、規劃、工具調用、海量上下文管理、記憶調度設計。
英偉達的 AI 超算曆程:從首台 AI 超算 DGX1,到 Pascal、NV Link,再到首款機櫃級 AI 超算 Grace Blackwell,如今推出首款多機櫃集群級智能體超算 Vera Rubin。
Vera Rubin 由台積電 3 納米工藝打造,包含 7 顆全新芯片,搭載美光、SK 海力士、三星的 HBM 內存,計算板集成 6 萬億晶體管、18000 個組件;NV Link 72 負責思考、提示詞與上下文理解、推理規劃。
全新模塊化計算鏈、PCB 中板設計,整合 Super Chips、ConnectX-9、Super Nyx、BlueField 4 DPUs,無線纜設計,保障 AI 工廠級可靠性;18 個計算鏈、9 個熱插拔 NV Link 交換鏈、高效液冷匯流排,承載超 5000 安培電流,整套第三代 MGX 機櫃包含 130 萬個組件。
微軟、戴爾、Core Weave 已上線 Vera Rubin NV Link 72 工程機櫃;Vera CPU 機櫃單櫃 256 顆 CPU,液冷設計,負責模型調度、內存管理、工具啓動;Grok 3 LPX 實現 40PB/s 內存帶寬,超低延遲推理;NV Link 72 保障高吞吐量,Grok LPX 保障低延遲;Vera Bluefield 4 STX 負責 AI 內存、存儲處理加速與安全;英偉達 Spectrum X 以太網光子器件,是全球首款 200G 同軸封裝光模塊交換機。
Vera Rubin 整合 5 大機櫃級系統,是智能體專屬超算,攜手中國台灣 150 家供應鏈夥伴、數百萬平方英尺廠房打造,用極致架構設計,為 AI 時代重新定義計算。感謝中國台灣。
Vera Rubin 不只是為 AI 而生,而是為運行智能體而生,是全球最先進的智能體計算系統。
過去 Hopper 面向預訓練,Grace Blackwell 面向推理,推理直接創造收益。複雜模型的推理需要兼顧高響應速度、交互性、吞吐量,難度極高,因此我們打造 NV Link 72,讓英偉達 Token 成本全球最低,差距達到數量級。Vera Rubin 則超越推理,面向智能體系統設計。
Vera Rubin 採用無線纜、無軟管、無風扇設計,中間 PCB 連接兩側組件,可靠性與彈性大幅提升。
四、Vera CPU:為智能體時代打造的全新 CPU
此前所有 CPU 都是為人類設計,以秒為時間單位,雲計算按核心租賃。但智能體沒有耐心,以納秒為時間單位,調用工具、訪問數據庫需要極致低延遲,等待會直接阻礙執行效率。因此我們全新研發 Vera CPU,專為 AI 智能體時代設計。
Vera CPU 在系統中有三大核心用途:
配套 Vera Rubin,每台 Vera Rubin 機櫃內置 2 顆 Vera CPU,負責 GPU 調度、KV 緩存管理、機櫃軟件運行;
Grace Bluefield 負責安全隔離;
承擔智能體調度框架、工具調用、數據庫與數據服務器訪問、高速存儲處理。
存儲服務器與 CPU 已成為數據中心最昂貴環節的關鍵路徑,AI 工廠的收益核心是 Token 產出,必須保障這一環節不成為瓶頸,因此我們從零打造全新架構 Vera CPU。
Vera CPU 四大核心優勢
全球最高單線程性能:每時鐘周期可獲取、解碼、執行 10 條指令,IPC(每時鐘周期指令數)全球第一;
極致帶寬:內核間帶寬、系統總帶寬全球頂尖,採用光速級互聯架構,3.6TB/s 截面帶寬,無芯片邊界延遲;
領先接口:首款 PCIe Gen 6 CPU,搭載 LPDDR5X,帶寬達 1.2TB/s,是高端 CPU 的 2-3 倍;
超高能效:智能體數量將遠超人類,需在不佔用 Token 生成電力的前提下,高密度部署 CPU,能效至關重要。
對比高端 x86 CPU,Vera CPU 的真實單線程性能提升幅度史無前例。
在智能體時代,CPU 是指揮,GPU 是樂團。傳統 CPU 為舊時代設計,最大化單插槽核心數、虛擬化分時租賃;如今 CPU 成為 GPU 利用率的瓶頸,直接影響 Token 吞吐量、延遲與用戶體驗。
Vera CPU 內置英偉達 Olympus 核心,針對現代數據中心工作負載(分支密集型 Python 運行時、工具調用、沙箱代碼執行)優化:
神經分支預測器,每周期處理 2 個分支;
10 寬度解碼引擎,單周期處理更多任務;
大型亂序執行引擎,保障指令流暢運行;
高級預取器與圖引擎,預判數據路徑;
支持 LPDDR5X,同時糾正多類錯誤,內存峯值延遲比 x86 低 40%;
第二代可擴展一致性架構,88 顆 Olympus 核心統一單片互聯,核心通信速度比傳統 CPU 快 50%;
NV Link 芯粒互聯,直接連接 GPU,可多插槽擴展。
Vera CPU 智能體沙箱性能是 x86 的 1.8 倍,獨立機櫃可運行智能體沙箱、工具、代碼、數據管道,與 Ruben GPU 緊密協同;Vera Bluefield 4 STX 支撐上下文內存、AI 存儲、計算、網絡、存儲一體化。
Vera CPU 將成為英偉達新的核心增長引擎,全球企業已同步適配。Grace 已全面普及,Vera 將成為全球最優化的智能體 CPU。
實際場景中,Vera CPU 運行 SQL 速度提升 3 倍,實時流處理速度提升 6 倍,性能提升達到數量級,這在 CPU 領域極為罕見。全球廠商均已表態支持 Vera CPU,它開啓了智能體專屬 CPU的全新市場,規模將超越傳統 CPU 市場。
五、英偉達企業 AI 工具包:讓每家企業都能打造智能體
智能體是未來十年的計算模式,每家企業都會成為智能體企業,都需要安全運行智能體、搭建專屬智能體的方案。英偉達推出企業 AI 智能體工具包,我們已為此籌備多年。
企業搭建智能體需要四大核心:
模型:大語言模型,越智能、低成本、高速越好;
調度框架:協調智能體全流程;
工具與技能:CUDA X 庫等高效工具;
運行環境:整合所有組件的操作系統。
英偉達智能體工具包提供:
可定製的世界級開源模型;
兼容各類智能體(Cloud Code、Codex 等);
開源安全調度框架 Open Shell,保障企業級安全、隱私、權限、身份,全球廣泛採用(紅帽、Canonical、微軟等);
全棧優化適配英偉達 AI 平台,支持雲端、本地、終端部署。
案例:芯片設計超級智能體
英偉達與 Cadence 合作打造芯片設計超級智能體,由 Codex/Cloud Code 調度,以 RTL、架構圖、規格書為輸入,實現設計驗證全流程自動化:
調用 Cadence Chipstack 啓動 RTL 驗證循環;
依託 Nemotron 模型,Open Shell 保障安全;
調用 RTL 生成、測試台創建、迴歸測試、調試子智能體;
數百次仿真、形式驗證同步運行,快速定位修復漏洞;
驗證周期從數周縮短至數小時,效率提升超 40 倍。
英偉達將部署數十萬計 Cadence 超級智能體,加速芯片研發。這正是模型、調度框架、加速庫工具、運行環境四大核心協同的成果。
Nemotron 3 Ultra:開源旗艦模型
今天我們發布Nemotron 3 Ultra開源模型,提供模型、訓練數據、訓練腳本全開源,聯合全球夥伴共建數據集,是全球最優質的開源模型體系之一。
Nemotron 3 Ultra 核心優勢:
速度提升 5 倍:採用 SSM 狀態空間模型 + 混合專家混合架構;
成本降低 30%:推理算力與耗時大幅優化;
完全開源,支持企業定製優化。
我們正在研發 Nemotron 4,全棧工具包讓全球企業都能像 Cadence 一樣打造專屬智能體。英偉達已與 Cadence、Crowdstrike、Palantir、SAP 等企業深度合作,智能體不會顛覆行業,反而創造史上最大機遇。
六、RTX Spark:與微軟聯手,40 年來重新定義 PC
40 年前,Windows 系統通過解耦、抽象、開放架構、驅動動態安裝、多媒體 API,讓 PC 普及全球。40 年後,英偉達與微軟重新發明 PC,面向 AI 智能體時代。
智能體將運行在 AI 雲、企業、個人 PC 等全場景,搭載自主智能體的 PC,能理解用戶、交互、處理文件、自主調研,實現全新交互體驗。
全新操作系統是傳統系統 + 大語言模型,相當於現代版 DirectX,支持多模態輸入輸出、計算機視覺、音視頻生成;應用層被智能體運行時替代,這就是現代應用 —— 智能體。
RTX Spark 核心配置
Blackwell RTX GPU,6144 CUDA 核心,1PFLOPS AI 算力;
與聯發科合作定製 20 核 Grace CPU;
NV Link 互聯,128GB 統一內存;
台積電 3 納米工藝,700 億晶體管;
與微軟深度協同,打造 Windows 智能體平台。
RTX Spark 筆記本完美兼容英偉達全軟件棧,CUDA、物理模擬、生物、基因組、AI、圖形全場景支持,兼容 Windows 全生態,同時原生運行智能體。
應用場景
建築設計:本地智能體調用 Rhino、Blender,根據指令完成場地建模、佈局設計、渲染,生成寫實效果圖,複雜工作流簡化為指令交互;
Adobe 生態:Photoshop、Premier 核心架構重構,速度提升 2 倍,支持智能體交互。
全球 PC 行業 100% 支持 RTX Spark,我們推出三大全新 Windows 設備:筆記本、台式機、工作站,100% 兼容 Windows、CUDA、英偉達 AI 與 Tensor Core,是 40 年來首次徹底重構的 PC 產品線。
RTX Spark 台式機:24 小時不間斷運行本地智能體,無算力焦慮,連接全屋設備,成為家庭 AI 中心;
DGX Station 4 Windows:768GB 內存,可運行萬億參數模型,20PFLOPS 算力,8TB/s 內存帶寬,專為大模型、智能體開發者設計。
未來 PC 將徹底顛覆現有形態,就像手機從通話工具變成智能終端。未來每個家庭都會配備 AI 超算,運行專屬智能體,成為像 R2D2 一樣的智能助手,這次 PC 革命的意義,等同於功能機到智能手機的跨越。
英偉達將持續迭代 PC 產品線,每代架構都覆蓋筆記本、台式機、工作站,全球 PC 生態全員參與,共啓全新篇章。
七、物理 AI:Cosmos 3、Alpha Mile 2 與人形機器人
智能體 AI 本質是數字機器人,未來將覆蓋全場景設備:機器人、自動駕駛、衛星、農業設備、工業設備、基站等,數百億智能體系統將遍佈全球。
物理 AI 的核心難點是數據:語言模型數據來自人類視角,而機器人需要第一視角感知數據,全球視頻數據多為第三人稱,因此物理 AI 數據獲取極難。
英偉達通過三大路徑突破:
遠程操作(人類演示);
仿真模擬(Omniverse);
第三人稱數據轉第一視角,最終打造世界基礎模型。
Cosmos 3:物理 AI 開源基礎模型
今天發布Cosmos 3,是物理 AI 的前沿開源模型,基於全新 Transformer 混合架構,支持像素、動作、聲音、語言輸入,實現推理、規劃、指令生成,登頂全球多項排行榜。
Cosmos 3 核心能力:
多模態大模型:感知物理世界,描述、識別關鍵信息;
世界模型:根據文本 / 圖像 / 視頻,生成物理精準的合成視頻;
仿真器:閉環訓練策略;
動作世界模型:預測未來,為各類機器人生成動作指令。
Cosmos 3 完全開源,支持開發者定製優化,成為專屬物理 AI 模型。
Alpha Mile 2:自動駕駛開源模型
今天發布Alpha Mile 2自動駕駛開源模型,全球約 80% 汽車廠商已接入英偉達 Hyperion 平台,97% 移動出行服務與我們協同,搭載 Alpha Mile 2 的 Hyperion 系統,將實現全球覆蓋。
Alpha Mile 2 是全球首款推理型自動駕駛系統,能自主思考、判斷、決策,應對複雜路況。
Isaac Groot:人形機器人蔘考平台
英偉達 Isaac Groot 是人形機器人開放開發平台,提供開源模型、仿真訓練庫、數據生成工具、機器人計算機,快速部署研發:
Isaac Sim 搭建仿真環境;
Isaac Teleop 完成真實 / 仿真機器人演示採集;
Omniverse 與 Cosmos 生成合成數據,單條演示擴至數千條;
訓練策略、仿真評估、部署 Jetson Thor 運行。
今天發布Isaac Groot 人形機器人蔘考設計:
單隻手 25 個自由度,全身 31 個自由度;
身高 6 英尺,體重 150 磅;
搭載 Thor 芯片,全棧軟件集成。
該平台專為高校、研究機構打造,降低人形機器人研發門檻,助力前沿研究。
結尾
過去半年,計算機行業被智能體徹底改變,實用型 AI 落地,智能體計算模式成為核心。這一模式將複製到雲端、本地、PC、機器人、衛星、基站、工廠等全場景。
Vera Rubin 全面量產,專為智能體打造;Vera CPU 開啓智能體計算新時代;英偉達與微軟重構 PC 生態;企業智能體工具包賦能全行業;物理 AI 與機器人技術持續突破。
感謝各位的合作與支持,明年我們將取得更輝煌的成就。歡迎來到 Computex,祝大家展會順利!