1991年,英特爾做了一件在當時看來有些奇怪的事:它開始花錢貼補PC廠商,條件只有一個——在電腦外殼上貼一枚小小的「Intel Inside」貼紙。
這個決定改變了整個PC產業的權力結構。
那枚貼紙是品牌案例繞不開的經典,而背後是一套精心設計的生態綁定機制:用戶開始認牌子買電腦,OEM廠商因此不敢輕易換芯片,軟件開發者隨之向英特爾架構優化,三角鎖定一旦形成,英特爾就此主導PC生態長達三十年。
更大程度而言,這是一個關於「平台定義權」的故事。誰定義了PC的核心架構,誰就收取了整個產業最穩定的租金。
三十年後,這個故事正在被重寫。只是這一次,主角換成了英偉達,而合作伙伴還是那家來自雷德蒙德的老朋友:微軟。
2026年6月1日,台北國際電腦展。黃仁勳穿着標誌性皮衣走上舞台,發布了一款叫做RTX Spark的芯片。
從技術參數上看,這是一款極其激進的產品:與聯發科聯合研發的N1X處理器,台積電3nm工藝,Blackwell RTX GPU加20核Grace CPU,128GB統一內存,700億晶體管,本地AI算力達到1 petaflop。
黃仁勳說,「40年前,Windows開啓了PC時代;40年後,微軟和英偉達將重塑PC。」
聽起來就很燃。
英偉達正在做的是複製「Intel Inside」的底層邏輯,只不過這一次,鎖定的不再只是CPU指令集,而是整條AI計算和開發棧。
而且規模更大,野心更遠。它要綁定的不只是硬件,還包括整個AI時代的計算範式。
要知道,英偉達真正的護城河不是GPU硬件,而是CUDA,是已經運行了將近二十年、全球數百萬開發者在上面訓練模型、調試算法的軟件生態。
換掉英偉達的GPU,意味着放棄所有基於CUDA優化的代碼、工具鏈和工作流。這個遷移成本,讓競爭對手的芯片性價比再高也難以撼動市場。
這是英偉達在數據中心建立的壁壘。而RTX Spark,是英偉達試圖把同樣的邏輯複製到PC端的第一步。
它的目標不只是賣出更多芯片,是讓「本地運行AI Agent」這件事成為新一代PC的標準定義。
RTX Spark將搭載Windows系統,戴爾、華碩、惠普、聯想、宏碁等主流OEM廠商均宣佈跟進,秋季開始陸續出貨。
微軟方面則將整個Windows的Agent能力與英偉達的硬件架構深度綁定。
就在RTX Spark發布後不久,微軟CEO薩提亞·納德拉在北京時間今天凌晨舉行的微軟Build 2026大會上,專門邀請黃仁勳進行了一次深度連線對話。
兩人從端側談到雲側,從RTX Spark談到Vera Rubin超級計算機,從芯片架構談到AI Agent的未來範式。
黃仁勳透露了一個細節:這次合作實際上起源於大約三年前,他與納德拉的一次私下對話。那時候,兩人就在討論,能不能做一台專為AI和創作者設計的全新PC?
三年,從一次私聊到全球發布,再到主流OEM廠商集體跟進——這個周期,說明這不是一次倉促的產品決策,而是一次早有籌謀的平台卡位。
今天這場對話,也是理解英偉達與微軟這場戰略合謀最直接的一扇窗口。
以下,是那場對話的全文。聰明投資者(ID: Capital-nature)整理分享給大家。
納德拉
這幾天我一直在看社交媒體,也在看大家從你周末主題演講之後都在討論什麼。突然之間,「邊緣側的不限量智能」(強大的AI不再是雲端的稀缺資源,而是每台設備上隨時可用的基礎能力,就像今天的電量和內存一樣,用戶不需要為每次調用付費或等待響應)這個概念又重新變得非常熱門。
你很早就在思考這個問題,也講過很多次。現在,隨着RTX Spark的推出,我覺得你們真正交付了一個突破性的系統,讓AI可以變得更加無處不在。
也許你可以和我們分享一下,你對這個方向的願景,以及你覺得它會走向哪裏。
黃仁勳
這件事其實要追溯到大約3年前,當時我們兩個人有過一次對話。我們在聊,能不能打造一種全新的PC,它對設計師和創作者來說會非常強大,同時也會非常適合人工智能。
它需要具備足夠強的處理能力,同時還要有完整的軟件棧,能夠和全球的設計軟件、創作者軟件,以及我們正在做的所有AI工作深度集成。
3年之後,我們真的走到了這裏。我們做出了一顆非常了不起的新芯片,而這個系統也得到了你們為Windows打造的這些全新軟件的支持。
現在,我們已經可以在PC上運行一個本質上具備自主能力的智能代理。
如果退一步想想,這意味着什麼?過去30多年,或者說40年裏,我們兩家公司一直在合作。從當年一起發明 DirectX,到今天打造出這樣一台可以運行自主系統的強大計算機,PC已經發生了非常大的演變。
PC從一個非常強大的工具,變成了一種可以被 AI 助手自主使用的工具。
也就是說,我可能正在外出旅行,手裏拿着手機,我可以給自己的PC發一條消息,讓它幫我完成一些代碼工作,或者實現我剛想到的一個創意。它會自動啓動 PC 上的工具,按照我的要求去修改、調整或者完成設計。
而且在我不在電腦旁邊的時候,它還可以和我不斷迭代。
我的PC變成了一個助手。當然,當我坐在電腦前的時候,它同樣也會是一個非常好的助手。
所以,PC從personal computer,也就是個人電腦,演變成personal AI,也就是個人 AI。這件事真的非常令人興奮。
看到它真正變成現實,看到它真的開始這樣工作,我非常激動。
你剛纔提到的Spark,擁有非常強大的能力。它有 1 petaflop 的AI性能。
這是一種我們兩家公司共同推動的數值格式。它讓我們能夠充分利用這128GB 內存,放下可能高達幾千億參數的模型。
而幾千億參數的模型,已經是當前最前沿的水平。
我認為,在PC上運行一個真正聰明、能夠自主工作的助手,這一天已經到來了。
納德拉
我也非常期待Windows登上GB300,那有點像把數據中心直接搬到了桌面上,非常令人興奮。
說到這裏,我們也可以聊聊數據中心這一端。
很顯然,這一切最早是從我們一起建造第一台超級計算機開始的,那台機器是為了訓練GPT模型。一路走到今天,我們已經走了很遠。
我剛纔也談到了Fairwater的設計。它本質上是為Grace Blackwell 時代專門打造的,是為了把你們的系統設計能力和數據中心設計能力最大化結合起來。
現在,我們當然也在驗證Vera Rubin,對此非常興奮。也許你可以再談一談,在雲端這一側會發生什麼,你們又是如何推動系統層面的創新的。
黃仁勳
我們的這段旅程確實非常了不起。我們一起打造了第一台AI超級計算機,那一代是基於Ampere的。
後來,Hopper取得了巨大的成功。
前兩代主要聚焦在預訓練。
到了Grace Blackwell,重點轉向了後訓練,也就是強化學習。這讓我們擁有了推理模型。而這些基於混合專家架構的推理模型,既非常聰明,也非常節能,但它們需要巨大的系統來支撐。
所以我們打造了NVLink 72,讓整整一個機架變成一台計算機。我們從一個節點,演進到一個機架。
今天,微軟部署了全球數量最多的Grace Blackwell,也是最快、規模最大的Grace Blackwell部署。Fairwater是一個非常壯觀的系統。它是一項工程奇蹟,真的是非常了不起的成就。
它完全採用液冷,就是它是閉環系統,基本上幾乎不消耗水,而且非常環保。
它的能效非常高。我們能夠把token生成速度大幅提升,同時把token生成成本降低一個數量級,相比Hopper大約提升了30倍。這是一個巨大的成就。
而Vera Rubin是為另一個世界打造的。在那個世界裏,AI已經是agentic的,也就是具備代理能力、能夠自主行動的。
Hopper是為預訓練打造的,Grace Blackwell是為訓練、後訓練以及推理打造的,而 Vera Rubin是為運行智能代理而設計的。
你很清楚,智能代理這種計算模式,和我們將在RTX Spark上運行的計算模式完全一樣。它本質上就是同一種代理系統,只不過在雲端,它的規模會大得多。
我們會同時處理數量極其龐大的智能代理,其中很多來自不同客戶、不同合作伙伴。
因此,從存儲,也就是長期記憶,到工作記憶,整個路徑、整個代碼路徑都必須加密。數據在傳輸過程中是加密的,數據在使用過程中也是加密的。
所以我們會在機密計算領域進行真正的創新。
這整個解耦的、分佈式的計算系統,你剛纔也提到了CPU。Vera是一款為智能代理而設計的革命性CPU。
過去的CPU是為人設計的。我們人類比智能代理更有耐心。智能代理需要的是低延遲,這也是你們一直在推動的方向。Vera就是為極低延遲而設計的。
我們兩邊的團隊一直合作得非常緊密。幾乎在芯片tape-out很久以前,在系統真正啓動很久以前,我們兩個團隊就已經完全對齊了。
數據中心是為Vera Rubin而設計的;Vera Rubin 也是為你們的完整技術棧而設計,並且已經集成進你們的網絡、安全體系以及整個架構之中。
因此,當我們的系統從產線下來的時候,它們就已經在微軟那邊被架設起來了。我對這次合作真的非常興奮。
納德拉
是的,看到兩個團隊以這種接近光速的執行力推進,真的非常棒。
當然,我們做這一切最終都是為了賦能我們周圍的整個生態。
你和我都經歷過PC 時代、服務器時代,現在又走到了AI時代。我們一直相信,最終最重要的事情,是為每一位開發者、每一個組織創造機會,讓他們能夠在我們所做的工作和我們搭建的平台之上繼續創造。
說到這裏,英偉達也有很多軟件正在進入我們的生態。比如,你們的模型會進入Foundry,你們的工具也會進入Foundry。事實上,你們的軟件還會幫助我們加速很多工作負載,甚至包括數據倉庫這類工作負載。
當然,Windows裏面也會有很多相關能力。也許你可以談一談這個更廣闊的願景。因為大家經常談某一個模型,或者某一項技術,但真正重要的是,這是一個更廣、更大的機會,讓人們可以在上面創造價值。
黃仁勳
我們其實已經為這一刻準備很久了。
過去幾個月發生的事情,我們兩家公司其實已經一起準備了15年。過去幾個月,突然之間,因為代理系統的出現,因為這些非常優秀的模型開始匯聚,AI 終於變得真正有用了。
你只要看GitHub就能看到,提交到GitHub的代碼數量已經呈現出完全拋物線式的增長。過去幾個月裏,提交數量增加了3倍。
這清楚地說明,代理系統是有用的,它們正在做真正有生產力的工作。而且,token 現在也開始變得有利可圖。
所以,一方面是AI使用量的增長,另一方面是智能代理所需要的計算量,兩者疊加在一起,計算需求真的已經衝上去了。
我們兩家公司一直在做的一件事,就是確保這些智能代理將要使用的所有工具,都能夠被充分加速。
比如Fabric現在已經實現了全面加速。我們正在加速數據處理,包括SQL、Spark、基於語義的處理、基於向量的處理、基於圖的處理。
我們要確保Azure上所有可用的工具,都能夠被GPU全面加速。因為智能代理是沒有耐心的。
我們越快把答案返回給智能代理,它們就能越快迭代,也就能越快生成token。而這最終也是開發者、我們雙方客戶真正想要的:生成大量真正有價值、真正聰明,而且能夠帶來利潤的token。