AI從訓練轉向推理,CPU在AI時代日益重要且不可或缺。這點從芯片巨頭和研調機構對未來市場空間(TAM)的預測和修正就能很直觀的感受到:
2026年5月,AMD首席執行官蘇姿豐(Dr. Lisa Su)在2026年一季度財報電話會上上調了對全球服務器CPU市場的長期預測:預計到2030年,服務器CPU的TAM將以超過35%的年複合增長率(CAGR)高速飆升,達到1200億美元以上。而就在數月前,這一數字的預測還僅為600億美元。
華爾街投行花旗銀行(Citi)在2026年5月中旬的客戶報告中更加樂觀,將2030年全球CPU市場規模錨定在1315億美元。Arm官方也將其相關的TAM鎖定在了千億美元級別。
英偉達則更為激進,其在2027財年一季度電話會中提到,Vera CPU將為英偉達打開一個「全新的2000億美元TAM」,並稱公司今年已能看到接近200億美元的CPU收入可見度。 隨後路透社的報道稱,黃仁勳確認英偉達對CPU市場這2000億美元的預測包括中國市場,並表示公司正在加速Vera Rubin平台生產。
短短幾個月裏,數據中心CPU市場的想象空間從600億美元、1200 億美元,進一步被推高到2000億美元級別。CPU確實在加速膨脹,那麼問題來了,AI 時代的數據中心,為什麼突然需要這麼多CPU?
Agentic AI,重新定價CPU
隨着AI基礎設施正在從訓練中心轉向推理中心,進一步轉向智能體中心。CPU的參與度正在迅速增加。
早期傳統大模型推理更像是一次請求、一次響應:用戶輸入問題,模型生成答案。此時,GPU 負責大部分矩陣計算,CPU 主要承擔調度和數據準備。但 Agentic AI 不一樣,它要持續規劃任務、調用工具、訪問數據庫、執行代碼、檢索知識、協調多個子智能體,並在長上下文中保持狀態。
AMD CEO Lisa Su 在財報電話會上指出,隨着推理和智能體AI負載快速增長,服務器CPU 的計算需求正在被重新放大。原因在於,這類應用並不只依賴GPU和加速器完成模型計算,還需要CPU承擔大量系統層面的工作,包括任務編排、數據調度、並行執行、資源協調,以及作為GPU和加速器集群的頭節點,對整個AI系統進行統一調度。
TrendForce 引述 AMD 財報電話會信息稱,隨着智能體 AI 發展,行業正在從長期以來「一顆 CPU 對四到八顆 GPU」的配置邏輯,轉向下一代數據中心中更高密度、甚至接近 1:1 CPU-GPU 配比的方向。
英特爾公司CEO陳立武在摩根大通第54屆全球科技大會上,也指出,有客戶向英特爾反饋CPU與GPU的配置比例從1:8向1:1靠攏,甚至可達4:1。陳立武還表示,物理AI(具身智能)市場更是相當大。因此,我認為我有機會在CPU上發力,並推動新的架構來驅動定製化(purpose-built)的工作負載,以針對特定的工作負載進行優化。加速器也是同樣的情況,我們要確保我們擁有它。最近,英特爾剛從高通僱來了Alex(阿歷克斯)來構建物理AI,從硅片優化一直到軟件、到系統平台工程的整個全棧,並推動機器人或數字工人(digital workers)的解決方案。
英偉達強調,今天的數據中心已經演變為可以產生持續收入的 AI 工廠。客戶真正購買的不是某一顆 GPU,而是一整套 AI 基礎設施能力。因此,衡量 AI 基礎設施價值的關鍵指標,也不再是 GPU 單價,而是單位功耗下的 token 產出、單位成本下的 token 產出、系統在線率、資源利用率、部署投產速度、軟件棧長期可用性,以及設備資產的全生命周期價值。
CPU 市場被上修的根本邏輯:CPU 不再只是服務器裏的通用計算單元,而是AI工廠裏的系統調度中樞。當 AI 從訓練走向推理,從推理走向 Agentic AI,從單機服務器走向萬卡集群和 AI Factory,數據中心真正競爭的已經不是一顆 GPU,而是一個系統。在這個系統中,CPU承擔的是秩序角色:它調度任務、管理內存、搬運數據、協調加速器、處理控制流、支撐數據庫和工具調用,並把 GPU、DPU、NIC、存儲和軟件棧組織成一個可運行、可擴展、可計費的 AI 工廠。
x86雙雄,激戰正酣
從數據來看,目前在價值更高、利潤最豐厚的大型雲廠商數據中心服務器CPU採購中,AMD幾乎已經與英特爾平分秋色。
2026 年一季度,AMD的數據中心業務收入達到58億美元,按年增長57%,主要由 EPYC CPU 和 Instinct GPU需求拉動。公司同時提到,服務器CPU收入連續第四個季度創紀錄,按年增長超過50%;主要雲廠商都在擴大 EPYC 使用範圍,以支持從通用計算、數據處理,到加速器頭部節點和新興Agentic應用在內的一系列AI工作負載。
Mercury Research數據顯示,AMD在服務器CPU市場的出貨量份額已攀升至33.2%,而營收份額達到了創紀錄的46.2%。這意味着在2026年Q1全球所有出貨的服務器CPU中,每3顆裏就有大體1顆是AMD的。AMD賣出的處理器平均價格(ASP)顯著高於英特爾。
這暴露了一個隱憂——雖然英特爾依然握有近三分之二(約66.8%)的服務器CPU數量出貨控制權,但由於其中包含價格較低的常規或中低端芯片,導致其最終拿到的收入蛋糕被蠶食到僅剩53.8%左右。
英特爾作為是傳統服務器CPU的基本盤玩家,主要是靠至強(Xeon)生態長期覆蓋企業、雲、數據庫、HPC、網絡和邊緣計算。Xeon 6包括P-core和E-core兩條路線:E-core 側重高核心密度和性能功耗比,P-core則面向更廣泛負載、AI 和 HPC,並在每個核心中內置 AI 加速能力。
面對高價值數據中心市場被不斷分流,英特爾正在把 Clearwater Forest,也就是 Xeon 6+,視為下一輪反擊的關鍵產品。作為英特爾首款基於 18A 製程打造的服務器處理器,Clearwater Forest 預計將於 2026 年上半年發布,目標客戶主要覆蓋超大規模數據中心、雲服務商以及電信運營商。
這款產品的核心邏輯,是用更先進的製程和更高密度的核心設計,去回應雲端客戶對性能、能效和部署密度的要求。Clearwater Forest 最高將提供 288 個能效核心,相比上一代 Sierra Forest,其能效核心的單周期指令執行能力提升約 17%。對於英特爾而言,這不僅是一顆新一代 Xeon 處理器,更是其藉助18A製程重塑服務器CPU競爭力的一次關鍵嘗試。
雖然CPU市場在膨脹,但競爭維度也在升維。
AMD已經把CPU與GPU、機櫃級系統綁定在一起講。AMD的第六代 EPYC Venice 採用 Zen 6 架構和 2nm 工藝,面向雲、企業和 AI 工作負載;其中Verano是 AMD 第一款專為 AI 基礎設施打造的 EPYC CPU。AMD 還表示,Venice 將覆蓋吞吐優化、性能功耗比優化、性能價格比優化和 AI 基礎設施優化等不同方向,並計劃在 2026 年晚些時候發布。
AMD也正在加速對供應鏈的投資。Lisa Su 在台北表示,全球CPU市場需求高於一年前所有人的預期,CPU 市場已經趨緊;AMD正在與台灣夥伴擴大產能,並計劃向台灣 AI 產業投資超過 100 億美元,重點包括先進封裝、基板和機櫃級系統製造。其合作伙伴包括 ASE、SPIL、PTI、Wiwynn、Wistron、Inventec、Unimicron、AIC、Nan Ya PCB 和 Kinsus 等。
陳立武在摩根大通第54屆全球科技大會上透露,Intel 18A 已經支持 Panther Lake 進入量產階段,良率每月提升約 7%,進展超出內部預期。
在CPU方向上,他強調,英特爾必須推動更深層次的架構變革,逐步轉向更具定製化特徵的芯片設計;而在加速器方向上,英特爾將通過與 SambaNova 的合作補齊相關能力。
陳立武表示:「先進封裝、晶圓代工能力,以及我們正在引入的新一代CPU架構,這些組合在一起非常令人興奮。」他對英特爾未來競爭方式的理解,已經不再侷限於單顆芯片本身。陳立武指出,未來必須走向全棧式發展,而不能只停留在硅片或網絡層面。企業不僅要構建軟件能力,還要進行內存優化,並真正推動平台級方案,最終向客戶交付完整的機箱級系統架構。在這個過程中,沒有任何一家企業能夠單打獨鬥。陳立武特別強調合作的重要性,英特爾需要合作伙伴補齊能力,也需要生態夥伴共同支撐客戶落地。
英偉達Vera CPU,來勢洶洶
對於英偉達而言,一方面憑藉GPU穩坐數據中心龍頭位置,另一方面隨着Vera CPU 出手,GPU巨頭開始進入CPU 腹地。
英偉達過去已經有Grace CPU,並通過 Grace Blackwell 進入 CPU-GPU 超級芯片階段。英偉達官方資料顯示,GB200 NVL72 將 36 顆 Grace CPU 和 72 顆 Blackwell GPU 連接在一個機櫃級、液冷系統中,形成 72-GPU NVLink 域,以服務實時萬億參數模型推理等場景。
Vera則是更強勁的下一步。
在2027財年一季度電話會上,NVIDIA表示,Vera基於定製 Arm 核心,並與 Rubin GPU 和 NVLink端到端協同設計;相比 x86替代方案,Vera宣稱可實現最高1.5倍單核性能、2倍性能功耗比和4倍機櫃密度。英偉達還稱 Vera Rubin 將在 2026 年下半年開始生產出貨,Q3 起步,並通過跨五個加速機櫃集成七類專用芯片,較Blackwell實現最高35倍推理吞吐和最高10倍AI Factory收入提升。
英偉達不是想只做GPU,它要把 CPU、GPU、NVLink、DPU、NIC、交換機和軟件棧整合成一個完整平台,整個一鍋端。
這對英特爾、AMD、Arm、Broadcom、Marvell 等廠商都會產生壓力。對英特爾和 AMD 來說,英偉達正在侵入CPU腹地;對 Broadcom和Marvell來說,英偉達通過Spectrum-X、ConnectX、BlueField和NVLink體系,也在繼續壓縮外部互聯芯片供應商的系統話語權;對Arm來說,Vera是好消息,也是複雜信號——它強化了 Arm 架構在數據中心的存在感,但也可能讓 Arm 生態更多被英偉達平台綁定。
Arm下場做芯片,
服務器CPU生態生變
Arm是這輪CPU市場擴張中最值得關注的變量之一。
Arm 的 AGI CPU 是其第一款真正意義上的量產級芯片產品,專門面向智能體 AI 工作負載設計。這款處理器基於Arm Neoverse CSS V3平台打造,目標場景是高性能計算和高密度機櫃部署。採用了明顯的機櫃優先設計思路。根據 Arm 官方資料,一個 36kW 風冷 ORv3 機櫃,目標配置可以部署 30 台 1U 服務器,每台服務器搭載兩顆 Arm AGI CPU,合計可提供 8160 個高性能 CPU 核心。
從規格上來看,Arm AGI CPU 最高可提供 136 個 Neoverse V3 核心,每個核心配備 2MB 二級緩存,採用 Armv9.2 架構,支持 bfloat16 和 INT8 AI 指令,熱設計功耗為 300W。同時,它支持 12 通道 DDR5-8800 內存,每個核心最高可獲得 6GB/s 的內存帶寬,並配備 96 條 PCIe Gen6 通道,支持 CXL 3.0 內存擴展和互連能力。
Arm在官方博客提到,Meta是AGI CPU 的主導合作伙伴和客戶,雙方共同開發這款芯片,用於優化 Meta 面向千兆瓦級 AI 基礎設施的部署,並與 Meta 自研的 MTIA 加速器協同工作。
Arm在2026財年四季度電話會中明確提到,到FYE31,公司預計AGI CPU收入將達到150 億美元,IP收入達到100億美元,合計收入目標為250億美元。
對 Arm 來說,AGI CPU 不是一次簡單的產品發布,而是公司商業模式的一次邊界擴張。過去,Arm 更多站在服務器 CPU 產業的底層,通過架構授權和 IP 版稅參與 AWS、Google、Microsoft、NVIDIA、Ampere 等客戶的數據中心芯片增長;但 AGI CPU 的出現,意味着 Arm 第一次以成品硅片供應商的身份直接進入數據中心 CPU 市場。
不過,Arm 的角色也因此變得更加微妙。一方面,它依然可以通過 Neoverse 架構、CSS 計算子系統和 IP 授權模式,持續從雲廠商自研 CPU 中獲益;另一方面,當 AGI CPU 進入量產級芯片市場後,Arm 也可能與部分採用其 IP 授權的客戶形成新的競爭邊界。
但無論如何,Arm 已經不再只是過去那個以移動端架構聞名的 IP 公司。它正在成為數據中心 CPU 市場中越來越重要的底層架構提供者和基礎設施級玩家。
寫在最後
在AI的上半場,行業記住了GPU的狂飆;而在AI的下半場,加速膨脹的CPU正用實力證明,重塑科技未來的系統級算力新秩序,依然離不開這位歷久彌新的主控之王。
而這片CPU的新藍海,註定不會是風平浪靜。無論是AMD在營收份額上的步步緊逼,英特爾依託18A先進製程的生死反擊,英偉達憑藉Vera平台祭出的「一鍋端」式系統包攬,還是Arm帶着AGI成品硅片打破商業邊界的親自下場,都預示着一場升維的算力戰爭才啱啱打響。