
文/羅茜
"AI正在成為現代世界的基礎設施。"
3月10日,在NVIDIA GTC 2026開幕前夕,英偉達創始人兼首席執行官黃仁勳在官方博客中寫道,AI不再只是一個應用或單一模型,而正在像電力和互聯網一樣,成為新的基礎設施。放眼全球,芯片工廠、計算機組裝廠和AI工廠正在以前所未有的規模建設,價值數萬億美元。
資本市場與科技界關注的絕對重心,也從大模型本身,轉向AI這一複雜系統的能源、芯片、基礎設施、模型與應用。GTC 2026也因此定調——AI工廠(AI Factories)、智能體(Agentic AI)和推理(Inference),是核心議題。
AI即基建。作為與英偉達跨越三十年的緊密合作伙伴,聯想集團站上了一個更值得被市場清楚看見的核心位置。
聯想集團與英偉達的同盟,早已告別了"你供芯片、我造設備"的模式,而是升級到了"全棧AI戰略共同體"。近年來,英偉達不斷拓展算力的上限,聯想則持續把這種能力轉化為可交付、可運維、可複製的基礎設施產品。前者決定技術邊界,後者則決定這些技術能否真正進入企業與行業場景。
在此刻,當AI被黃仁勳定義為"人類歷史上最大規模的基礎設施建設",市場如夢初醒,為什麼他此前會宣告,未來三年與聯想集團的業務合作規模,將擴大至當前的四倍。因為,未來價值創造的重心,不只屬於芯片與算力本身,也屬於把算力變成系統、把系統變成交付、再把交付變成可複製能力的那一層。
因此,今年GTC大會真正重塑的,不只是英偉達的產品路線,更是整條AI產業鏈的分工想象。當Agentic AI爆發引發成本討論,當AI從訓練驅動轉向推理驅動,當AI從模型競賽轉向基礎設施競賽,市場關注,聯想集團將如何卡位這波萬億級的AI基建新浪潮,充分釋放合作紅利。
從工作站到AI雲工廠
"當你和我第一次見面時,正值PC革命的起點。那是一次重大的平台遷移:從大型機和數據中心的客戶端、服務器架構,轉向PC。此後,我們又親歷了多次平台變革,從PC到互聯網,從互聯網到雲計算,再從雲計算到移動計算。而現在,一個全新的平台正在形成。"就在兩個月多前,在參加聯想集團舉辦的Tech World大會時,黃仁勳如此回顧雙方的合作之旅。
到了GTC 2026前夜,這個"全新平台"的謎底呼之欲出:以AI為核心、以推理為驅動、以基礎設施為底座、能夠實時製造智能的新型計算平台。
按照黃仁勳的"五層蛋糕"理論,芯片之上、模型之下的"基礎設施層",是一項涵蓋供電、散熱、網絡互連與全棧調度的系統工程。聯想集團卡位於此萬億級的AI基建賽道,是三十年工程壁壘演進的必然。
一開始,雙方的合作建立在極其紮實,甚至顯得有些枯燥的產業分工之上。早在2010年,聯想集團在ThinkStation D20、S20、E20 等機型上採用了NVIDIA Quadro專業顯卡。2015年,這種結合擴展到了ThinkPad P50、P70移動工作站領域。2019年,聯想集團推出支持NVIDIA Quadro RTX和Tesla T4的ThinkStation P920 Rack,合作開始從專業圖形與終端工作站,走向更接近數據中心和加速計算的系統形態。
聯想集團在底層硬件架構上打磨出的工程默契,成為了日後承接更龐大的系統級併發算力的基礎。隨着AI爆發,在過去短短几年的時間內,聯想集團完成了一場從"硬件通道"向"AI基建核心"的驚人進化。
在2024年3月的GTC大會上,聯想集團與英偉達聯合發布了面向企業和雲場景的混合式 AI 解決方案,合作第一次明確從硬件協同,走向"企業與雲的AI平台"。半年後的Tech World上,聯想集團把合作從若干產品、若干項目,提升為一套覆蓋個人、企業和公共AI的"混合式 AI"的總戰略。
2025年的GTC大會,雙方合作向智能體(Agentic AI)的方向推進,強調可規模化的智能體解決方案、企業工作流效率提升,以及商業生產率的改善。2026年初的Tech World,聯想集團公開發布了AI雲超級工廠,並明確提到將支持下一代Vera Rubin平台。"AI雲超級工廠",已經不再是簡單意義上的服務器或企業平台,而是明確面向全球AI雲服務提供商的工廠化、系統化建設方案。
對於今年GTC大會,市場真正追問的,已經不是"有沒有更強的芯片",而是"更強的芯片將怎樣嵌入新一輪基礎設施擴張"。這也解釋了,聯想集團與英偉達合作為何在今年顯得格外重要, 雙方開始圍繞如何把AI作為基礎設施建起來、交付出去並跑起來,形成更深的分工。而未來價值分配的一大部分,也將落在誰能把芯片和模型之間那層複雜、昂貴、重工程的系統搭起來。
GTC 2026把這個問題前所未有地擺到了台前。
Agentic AI的基建紅利
"2026年可能成為Agentic AI元年", 華泰證券最新研報指出,AI推理正在上升為系統級基礎設施。
近期受到大量關注的 Claude Code,以及開源agent框架Open Claw這類工具,正在改變人們使用軟件的方式:AI不再只是聊天窗口裏的助手,而開始更像一個能持續調用工具、編寫代碼、執行任務、維護會話和管理工作流的"數字員工"。
智能體爆發的落點,就在基礎設施上。
一旦AI智能體從研究階段走向大規模應用,算力需求就會從集中式模型訓練,進一步擴展到海量實時推理與持續運行的agent網絡。這意味着一個重要轉折:AI的使用頻率將從"偶爾調用"變成"全天候運行"。企業內部的每一個崗位、每一個業務流程,都可能對應一個長期在線的AI agent;而這些agent不只是請求一個模型回答問題,它們還要調用工具、訪問上下文、保持狀態、協同執行,甚至在多個系統之間來回穿梭。
McKinsey在2025年《State of AI》裏寫得很明確:Agentic AI正在加速擴散,但大多數組織仍停留在從試點走向規模化影響的過程中;Gartner的判斷則更冷,到2027年底,超過40%的Agentic AI項目可能因成本高、商業價值不清或風控不足而被取消。
因此,市場一邊追逐智能體,一邊又迅速把問題從"能不能做"轉向"值不值得做"。
對資本市場而言,這意味着系統能力、推理成本、部署效率和長期運行的可靠性,第一次同時成為投資問題。在GTC 2026前瞻中,瑞銀(UBS)發布報告指出,本次大會的主題將繼續從芯片性能比較,轉向由"工作負載解耦(Disaggregation)"和"極致協同設計(Extreme co-design)"驅動的"系統級優化(System-level optimization)"。瑞銀強調,市場將重點審視系統的可擴展性、網絡領導力以及 AI資本開支的持續性。
也正是在這個節點上,黃仁勳開始反覆把話題拉回到推理 token 成本。年初發布 Rubin 平台時,NVIDIA 官方給出的核心口徑,已不再只是傳統意義上的算力提升,而是推理token 經濟學:相較Blackwell,Rubin平台可實現最高10倍的推理 Token 成本下降。NVIDIA開發者博客則進一步解釋,對長上下文、以推理為主的工作負載,Vera Rubin NVL72可將每百萬token的成本壓到Blackwell NVL72的十分之一。
一旦把"tokenomics"當成新的觀察座標,聯想集團與英偉達這段合作的意義更明確了:這是圍繞推理成本、部署效率和系統交付重新組織分工。也就是說,把token成本打下來,靠的絕對不僅僅是Rubin芯片本身,而是承載它的物理系統——這正是聯想攫取巨大商業紅利的核心邏輯。
聯想集團此前公開的吉瓦級AI工廠計劃,恰恰是這一變化的最好註腳。聯想官方對這套方案的定義,不是單台服務器,也不是單個企業平台,而是面向AI雲廠商的預集成基礎設施,核心賣點包括:統一的混合式 AI 基礎設施、NVIDIA 加速計算平台,以及以time to first token(TTFT)為核心的部署效率。這裏的評價維度已經不是"有沒有合作產品",而是"能否更快跑出第一個 token,能否更快進入生產環境"。
已有市場報道指出:聯想集團與英偉達這項合作的核心目標,正是幫助AI雲服務提供商更快地將數據中心投入運行,把極其複雜的算力集羣部署時間極度壓縮至"短短几周"。 市場期待,本次GTC大會上,聯想集團如何配合英偉達的新一代算力平台,通過極致的系統集成與部署效率,真正把Agentic AI的單Token成本打下來,喫下推理時代萬億美元的資本開支紅利。
"最不能出錯"的驗證場
對資本市場來說,最有說服力的從來不是概念,而是場景;不是實驗室裏的性能跑分,而是現實的壓力測試。
如果一套系統能夠在賽事轉播、實時數據處理、裁判輔助和全球運營調度中跑通,它才更有資格被視為真正的"基礎設施能力"。正因如此,聯想集團將在此次GTC上公布什麼樣的體育方案,值得市場期待。
聯想集團與F1的合作,已不是簡單的設備讚助,而是深入到其媒體與技術中心(Media & Technology Centre)的高性能計算環境中。據其官方披露,F1 依靠聯想技術向全球超過8.2億粉絲提供賽事內容;在一個典型比賽周末,F1 在賽道端 Event Technical Centre與英國Biggin Hill的媒體技術中心之間傳輸超過600TB的實時數據,後台則運行着180多個定製軟件系統。
2026年1月,雙方進一步將Neptune液冷技術部署到F1的HPC環境中,目標不僅是提升性能,也是在不顯著增加能耗的前提下支撐更高密度的AI與數據負載。對聯想集團而言,這類場景的價值,不在於"又服務了一個大客戶",而在於它證明公司已經能夠在實時轉播、賽事運營和全球分發這種最不能掉鏈子的環境裏,把基礎設施能力做成連續運行的系統。
更令人矚目的是FIFA。FIFA World Cup 2026將是史上最大規模的一屆世界盃,預計48支球隊、104 場比賽,橫跨北美三國、16座城市。FIFA與聯想集團已經披露的具體應用包括:Football AI Pro,即面向全部48支參賽隊的生成式AI知識助手;用於半自動越位判定與轉播呈現的AI-enabled 3D player avatars;以及新一代Referee View,通過AI穩定算法在實時畫面中減少模糊和抖動。
面對世界頂級賽事,聯想集團真正交出的,不只是幾項"好看的AI功能",而是一種更有資本市場含義的能力組合:複雜系統集成、實時數據處理、全球化部署,以及在高風險環境下的持續運行。
回到"五層蛋糕"理論,芯片公司可以定義性能邊界,模型公司可以定義應用想象,但真正把能力拉進現實世界、變成賽事、轉播、運營和裁判系統的一套可運行方案,需要的卻是另一種能力:把算力、網絡、散熱、軟件、設備與服務組織成一個不會在關鍵時刻失靈的系統。F1和FIFA之所以關鍵,不是因為它們"有名",而是因為它們把聯想集團的交付能力放到了最公開、最苛刻、最難容錯的環境裏。
對於聯想集團而言,GTC 2026是一場硬核實力的自證。市場期待,聯想集團能通過這些"最不能出錯"的極端場景實戰成績,向全球投資者毫無保留地證明,這些生產級AI場景,是該企業在AI基礎設施產業鏈中位置上移的證據。