1月8日,英偉達創始人兼 CEO 黃仁勳 接受了海外播客 No Priors 的深度訪談。本次對話發生在 AI 產業從「規模擴張」轉向「邏輯推理」的關鍵節點,全方位探討了 Scaling Law 的本質、AI 工廠的商業模式、對基礎設施的重定義、以及具身智能與數字生物學的突破路徑、對「AI 泡沫論」的反擊等話題。
黃仁勳指出,AI 已徹底脫離傳統「預錄製軟件(如 Excel)」的範疇,進化為持續消耗能源並實時產出智能 Token 的「AI 工廠」。黃仁勳強調,這種範式轉移意味着在摩爾定律失效的背景下,計算的產出效率已不再依賴晶體管的堆疊,而是轉向算法、架構與硬件的「三重紅利」。他預判,未來十年 Token 生成成本將實現 10 億倍的爆發式下降,這將驅動全球價值 2 萬億美元的研發預算從傳統的「溼實驗室」向超級計算機集羣進行結構性遷移。
針對 AI 失業論,黃仁勳提出了「任務與目標」剝離的視角,他以放射科醫生為例指出,AI 雖然承擔了「研究掃描圖」的任務,卻強化了「診斷疾病」的終極目標,這種效率提升反而會通過釋放社會對高質量醫療的潛在需求,導致相關崗位數量不降反增。
黃仁勳指出,AI 基礎設施的巨大電力缺口已成為全球氣候創新最強有力的引擎。他認為,正是由於 AI 產業對算力的極致渴求,才倒逼了核能、小型模塊化反應堆(SMR)及新型電池技術的跨越式發展,AI 將成為可持續能源有史以來最強大的驅動力。此外,他認為未來5年是「垂直化爆發之年」,指出行業已成功跨越「幻覺」難題,AI 正在法律、醫療及具身智能領域實現 99.9999% 的工業級可靠性。
01、行業成功解決幻覺難題,高價值推理 Token 已實現商業盈利
2025 年作為 AI 風暴中心的親歷者,回顧這一年,哪些變化最令你驚訝?特別是在解決 AI 曾廣受詬病的幻覺和生成無意義內容方面,行業取得了哪些實質性進展?這種飛躍如何體現在醫療、法律等垂直領域的實際應用中?目前推理 Token 的生成率和盈利表現如何?
黃仁勳:有些事情是在預料之中的,例如 Scaling Law 的持續生效並沒有讓我感到驚訝,技術的穩步演進也在意料之中。令我欣慰的是事實置根(Grounding)能力的提升、推理能力的進步,以及所有模型與搜索功能的深度整合。現在模型前端普遍引入了路由器,能根據答案的置信度自主決定是否進行深入研究,這從整體上提高了回答的質量和準確性。我對此深感自豪,整個行業成功解決了 AI 最受質疑的難題之一,即幻覺和生成無意義內容的問題。今年,從語言、視覺到機器人和自動駕駛,各領域在推理應用和事實置根方面都實現了飛躍。我為全行業的努力感到驕傲,令我略感驚訝的是,推理 Token 的生成率增長如此之快,似乎多個指數級增長在同時發生。更令人欣喜的是,這些 Token 現在已經能產生利潤。OpenEvidence 的毛利率達到了 90%,這些都是極具價值且盈利豐厚的 Token。Cursor 的利潤非常可觀,Claude、OpenAI 的企業端應用利潤表現也都很好。看到我們生成的 Token 質量足夠好、價值足夠高,以至於客戶願意為此支付高昂費用,這真的很棒。
(關於 AI 軟件本質)短期內最關鍵的一點是,AI 雖然是軟件,但它不是傳統的預錄製軟件。像 Excel 是由數百名工程師編寫、編譯並分發多年的成品。而 AI 會結合你的提問背景和全球實時信息,每一次都是實時生成。就像人類智能一樣,雖然對話基於事實和知識,但每個字都是當下生成的。AI 的獨特之處在於它需要計算機實時生成這些 Token。我稱這些設施為 AI 工廠,因為它們在源源不斷地生產供全球使用的 Token。
02、AI驅動了芯片、超級計算機和智能工廠三大產業鏈的大規模動工
你提出的「AI 工廠」概念如何重塑我們對基礎設施的理解?為了支撐這種前所未有的實時計算需求,目前在產業端和勞動力市場正在發生哪些結構性變化?
黃仁勳:AI 也是一種基礎設施,因為它影響着每個應用、每家公司、每個行業乃至每個國家,就像能源和互聯網一樣。為了滿足這種前所未有的計算需求,三個全新的產業正在興起:第一,我們需要更多的芯片工廠,像 TSMC 和 SK Hynix 正在大規模擴建。第二,我們需要新型計算機工廠,生產像 Grace Blackwell 這種全新的超級計算機,它的整個機架就是一個 GPU。第三,我們需要大規模的 AI 工廠。這三類工廠目前正在美國範圍內大規模動工。
這創造了對建築工人、管工、電工、技術員和網絡工程師的巨大需求,這種熟練勞動力缺口是驚人的。我很高興看到電工的薪水翻倍,他們現在像商務人士一樣到處出差去支援建設。這三大產業正在創造海量的就業崗位。
03、生產力提升釋放了社會對高質量服務的潛在需求
AI 社區中常存在一種末日論調,認為技術會取代人類工作。但歷史證明技術變革往往在改變職能的同時創造更多崗位,結合核醫學、會計或護理等行業的現狀,請問該如何區分工作的「任務」與「目標」?如何理解 AI 在解決全球勞動力短缺(如老齡化、司機短缺)中的角色?
黃仁勳:我最喜歡 Geoff Hinton 的例子,他在大約五到七年前預測 AI 將在五年內徹底改變放射科並取代醫生。他的前半句是對的,現在 100% 的放射科應用都由 AI 驅動。但在八年後的今天,放射科醫生的數量反而增加了。
這就是工作的任務與目標之間的區別。放射科醫生的任務是研究掃描圖,但目標是診斷疾病。正因為 AI 能幫他們更深、更準地研究更多片子,他們能要求更多掃描並進行科研,從而更好地診斷疾病。醫院效率更高,病人更多,收入隨之增加,進而需要聘用更多的醫生。你工作目標是什麼,你在工作中執行的任務又是什麼,這兩者需要區分。我每天大部分時間在打字,那是我的任務,但打字顯然不是我的目標。AI 幫我自動完成打字任務,並沒有讓我清閒下來,反而讓我能處理更多工作,變得更忙了。
(關於企業效率)如果 NVIDIA 的生產力提高了,我們不會裁員,而是會去做更多創新性的事情。我們越有生產力,能探索的想法就越多,公司增長就快,利潤也隨之增加,從而支持我們追求更多願景。如果世界上的問題是有限且已解決的,提高生產力纔會縮減經濟規模,但現實顯然相反。關於機器人搶走工作的擔憂,現實是我們面臨嚴重的工廠勞動力短缺。大部分公司很難留住工人,全球卡車司機也嚴重短缺,因為很少有人願意長年累月四處奔波。機器人將填補由於人口老齡化帶來的日益嚴峻的勞動力缺口。自動化是在解決勞動力不足問題。而且大家別忘了,有了汽車,就誕生了機械維修行業。如果世界上有 10 億台機器人,那將催生全球最大的維修產業。AI 行業本身就在創造一場就業熱潮。
04、God AI在短期內是僞命題,開源是全球企業創新的氧氣
面對 AI 實現的複雜架構,你如何看待開源在其中的角色?現在有一種敘事認為全能模型應由垂直巨頭壟斷,這種「God AI」的觀點是否客觀?同時,一些 CEO 向政府遊說加強監管,這是否屬於「監管俘獲」以扼殺初創公司的競爭?
黃仁勳:我們可以把 AI 的實現看作一個五層蛋糕架構:底層是能源;第二層是芯片;第三層是基礎設施;第四層是模型;最頂層是應用。領先的實驗室選擇閉源無可厚非,那是投資回報考量。但如果沒有開源,初創公司和各行各業的傳統企業都將舉步維艱。那些擁有百年曆史的工業或醫療企業需要基於預訓練模型,根據專業領域進行微調,開源是他們創新的氧氣。我們絕不能破壞這個創新的飛輪。
(關於 God AI)或許未來某天會出現所謂的 God AI,但那一天的到來可能需要銀河系級別的時間尺度。談論從現狀直接躍遷到 God AI 並沒有實際意義,目前沒有任何公司或研究人員具備創造它的能力。要讓 AI 極度精通語言、基因、分子及物理規律,這種 God AI 現階段根本不存在。認為單一巨頭能壟斷它的想法過於極端且毫無益處。如果 God AI 真的無所不能,政府制定政策的意義又何在?我們應該回歸務實。
(關於監管俘獲)一些德高望重的人描繪的末日敘事極其有害,科幻小說很有趣,但這些論調對政府毫無幫助。當公司遊說政府去監管其他公司或行業時,這種行為顯然存在利益衝突。我無法揣測其內心,但監管俘獲確實令人擔憂。
05、AI性價比每十年提升百萬倍,未來成本將降低 10 億倍
目前 GPT-4 級模型的 Token 成本已大幅下降,這種性價比的提升源於何處?隨着 Scaling Law 推動模型規模持續擴大,我們該如何平衡訓練成本與推理成本?你對未來十年的 Token 經濟學有何預判?
黃仁勳:Andrej Karpathy 曾估計構建第一個 ChatGPT 的成本,現在同樣的模型在個人電腦上一個周末就能完成。我們提升 AI 性價比的速度是驚人的。每一代產品的架構都在改進,從 Volta 到 Ampere 再到 Blackwell,晶體管數量和容量都在增加。摩爾定律是每 18 個月翻倍、十年百倍,而在 AI 領域,十年可能實現百萬倍的增長。
(關於成本預判)結合硬件、算法和模型的優化,如果十年內將 Token 生成成本降低 10 億倍,我一點都不會感到驚訝。這就是 AI 的 Token 經濟學。
(關於 MoE 的紅利)雖然人們追求更大規模,但 MOE(混合專家模型)讓計算負擔並不會按年例增加。我們正獲得硬件、算法和架構的三重紅利。這種跨團隊的相互學習是行業進步的最大動力。隨着重心轉向後訓練,初創公司將利用開源基礎在垂直領域做到極致。
06、靈活架構與算法演進
在 ASIC 層出不窮的當下,英偉達為何始終堅持可編程架構?面對注意力機制、混合狀態空間模型(Hybrid SSM)等算法的快速迭代,這種靈活性如何轉化為成本優勢?另外,英偉達內部是如何利用 AI 工具提升工程效率的?
黃仁勳:專用 ASIC 在特定任務中表現出色,但 Transformer 變體演進極快。我們的 Nemotron 採用了混合狀態空間模型架構。堅持可編程架構的核心在於,摩爾定律失效後,每年數百倍的跨越完全依賴算法創新。因此,能支持任何算法的架構纔是最優解。
(關於兼容性與 MoE)這種靈活性保護了龐大的安裝基數。FlashAttention、SSM、擴散模型等新技術,甚至 CNN 和 LSTM 都能在英偉達平台上無縫運行。憑藉最新的 NVLink 72 技術,我們在生成 MoE Token 的成本上已做到全球最低。此前業內低估了 MoE 的推理難度,在推理端生成 Token 極其困難,而我們的架構解決了這一點。
(關於內部 AI 實踐)英偉達內部已經全面普及了 Cursor,每位工程師都在使用。我們現在每周一都有新員工入職,招聘規模驚人。如果工程師的目的是解決問題,而不僅僅是寫代碼這種任務,那麼 AI 將釋放他們去探索更多未知,這對公司價值巨大。
07、蛋白質生成進入飛躍期,推理能力將解決機器人的安全性難題
展望 2026 年,多模態與超長上下文將帶來哪些行業拐點?特別是在數字生物學領域,蛋白質理解與生成技術達到了什麼水平?同時,具備推理能力的端到端模型將如何改變自動駕駛與具身智能的安全性?
黃仁勳:推理能力的提升將使汽車從簡單的感知進化為推理駕駛,能夠拆解從未見過的場景。英偉達的自動駕駛棧安全性能目前全球第一。在多模態視覺、語言-動作模型與推理系統的協同下,人形機器人將迎來突破。
(關於數字生物學)我們將迎來數字生物學的 ChatGPT 時刻。我們已經掌握了蛋白質理解技術,最近開源了 LatteProtina 模型。已有不少公司嘗試端到端分子設計,涵蓋化學理解與蛋白質構象解析。以前研發重心在溼實驗室,現在正向超級計算機遷移。
(關於機器人安全性)我對機器人更樂觀。雖然人形機器人在機械電子方面仍有挑戰,比如 300 磅的機器人摔倒與兒童互動的安全風險,但這些終將解決。AI 會根據需求驅動不同的工具,無論是工業臂還是重型機械。在工業領域,必須達到 99.9999% 的可靠性,核心技術解決前 99%,剩下的精度則由垂直行業巨頭配合底層技術打磨完成。
08、AI需求正驅動核能與 SMR 技術的跨越式發展
面對 2025 年日益嚴峻的能源供應挑戰,你如何看待現有電力儲備對 AI 爆發的約束?如何評價政策轉變對工業革命的影響?同時,AI 基礎設施建設帶來的巨大需求,是否正在反過來驅動美國在新型電池、太陽能濃縮設備以及小型模塊化反應堆(SMR)等領域的創新?
黃仁勳:政府提出的能源政策轉向非常關鍵,必須承認,如果不是因為國家對能源增長情緒的徹底轉變,我們恐怕已經把這場工業革命拱手讓人。即便如此,電力短缺依然是當前最現實的約束。沒有能源,新工業就無從談起。事實上,我們已經處於能源匱乏狀態近十年了。增長離不開能源,我們需要所有形式的能源,包括天然氣、更多的併網能源以及用戶側能源。我們還需要核能,單靠風能和太陽能無法滿足工業級需求。雖然我們會利用一切可用資源,但在未來十年內,天然氣仍將是支撐增長的唯一現實路徑。
(關於氣候創新)這非常有意思,AI 產業的崛起正在反過來推動可持續能源產業。由於市場預見到了巨大的需求,即便短期內除了大規模天然氣外沒有更實際的方案,它依然成為了氣候創新的引擎。需求才是產業發展的終極動力。當歷史重寫時,AI 可能會被證明是可持續能源有史以來最強大的驅動力。我們必須在現實中尋找平衡。如果 90% 的聲音都在宣揚悲觀情緒,就會嚇跑那些本可以利用 AI 讓社會更安全的投資。我對未來的技術演進充滿期待。
09、為什麼說「AI泡沫論」過於膚淺
業界目前非常關注 AI 是否處於泡沫之中,特別是有人引用 MIT 的研究稱大多數企業部署收效甚微。如果迴歸計算的第一性原理,NVIDIA 的加速計算範式如何超越 AI 聊天機器人的範疇?如何看待 OpenAI 等應用層公司對算力「產能」的需求,以及量化金融和生物製藥研發預算向 AI 基礎設施的結構性遷移?
黃仁勳:理解這個問題需要回歸計算的第一性原理。NVIDIA 定義了加速計算,這一範式涵蓋了計算機圖形學、SQL 數據處理、分子動力學和量子化學,這些領域與 AI 並不重疊。核心動態是計算基礎正從通用計算向加速計算轉型,因為摩爾定律已基本終結。你不能再像以前那樣把 CPU 用於一切,它的產出效率和通縮效應已經不足以支撐現代需求。即便今天所有的聊天機器人都不存在,NVIDIA 依然會是一家數千億美元的公司,因為計算的底層邏輯已經發生了根本性轉移。
(關於產能與需求)針對 AI 泡沫的質疑,外界習慣僅通過 OpenAI 的收入判斷。但事實是,如果他們現在的算力產能翻倍,收入就會翻倍。在我們的世界裏這叫產能需求,在他們的世界裏這就是工廠需求。沒有工廠產能,他們就無法生成 Token,也就無法轉化為業務增長。
(關於研發預算遷移)AI 的內涵遠比聊天機器人豐富。我們的自動駕駛業務已接近百億規模,我們在數字生物學、金融服務等領域的 AI 工作同樣進展神速。尤其在量化交易領域,現在完全依靠 AI 發掘特徵。放眼全球 100 萬億美元的 GDP,每年約有 2% 投入研發。五年前,頂級藥企的研發重心都在溼實驗室裏,而今天他們都在建造超級計算機。這 2 萬億美元的研發預算,正經歷從舊模式向 AI 基礎設施模式的結構性遷移。沒有任何一個科學家會說自己的算力夠了。單純以應用層初期收入來定義基礎設施投入為泡沫,是極其膚淺的。
10、垂直化爆發與未來五年展望
想要觀察全球創新,為什麼應該關注初創公司而非大型企業?在醫療、保險等保守行業,像 OpenEvidence 和 Abridge 這種工具是如何通過解決「任務」來服務「工作目的」的?當我們思考未來五年時,AI 作為「多層蛋糕」架構將如何改變我們的研究模式(如閱讀 Arxiv 論文)?
黃仁勳:想要發現風向標,不應該去大企業,因為大企業通常是新技術最慢的採用者。你應該去和那三、四萬家活躍的初創公司交流。醫療行業是所有行業中最保守的,但正因為他們極度關注答案準確性,像 OpenEvidence 這種能產出高質量信息的研究工具才顯得彌足珍貴。醫生們不需要繁雜的搜索,他們需要直接的答案。Abridge 也是極佳案例,它讓醫生從枯燥的文書工作中解脫。
(關於認知極限與 AI 協作)從需求看,很多職位的工作量已超人類極限。以前我們必須親自讀 Arxiv 論文,我現在不再親力親為了。我直接將論文加載進 AI,讓它學習並進行多輪提煉。我們的目標是獲取答案並變得更聰明,而 AI 正是利器。
(關於未來五年展望)AI 就像一個多層蛋糕,它在各行各業展現出極高的多樣性。當我們思考如何獲勝時,不應僅僅追求某一家公司的勝出,而應該是全方位、跨領域的全面領先。工廠依賴能源,沒有能源就沒有工廠,沒有工廠就沒有 AI。整個行業在過去一年取得了巨大的跨越。Scaling Law 的持續生效讓我們確信投入更多算力就能獲得更高智能。一個領域的創新正以前所未有的速度滲透到所有其他行業。接下來的五年將是非凡的,明年更是不可思議的一年。