AI時代,被GPU搶盡風頭的CPU,或許正在悄悄迎來一場屬於自己的爆發。
據追風交易台,5月5日,瑞銀全球研究團隊發布了一份針對美國半導體行業的深度研報。面對投資者關於「代理式AI將如何影響服務器CPU市場」的密集提問,分析師Timothy Arcuri等人通過一系列行業專家訪談並結合自下而上和自上而下兩套模型,得出了一個明確的結論:
市場嚴重低估了AI時代CPU的價值。服務器CPU的潛在市場規模(TAM),將從2025年的約300億美元,增長至2030年的約1700億美元,五年漲幅接近5倍。
在過去兩年的AI狂熱中,GPU搶走了所有的聚光燈。但隨着AI從「單純的對話生成」進化為「自主執行任務的代理(Agent)」,算力的瓶頸正在悄然轉移。
代理式AI重塑算力格局:從「GPU主導」到「CPU迴歸」
要理解CPU市場的爆發,首先要理解代理式AI與傳統AI的工作負載差異。
在傳統的AI訓練和基礎推理階段,GPU是絕對的主力。如果把AI算力比作一個工廠,GPU就是流水線上不知疲倦的工人,而CPU則是負責分配任務的經理。在傳統模式下,一個經理(CPU)可以輕鬆管理多個工人(GPU)。
但代理式AI改變了遊戲規則。代理式AI不僅需要生成文本,還需要進行任務編排、工具調用(例如在沙盒虛擬機中執行代碼)、文件檢索等。這意味着「經理」的工作量呈指數級上升。
分析師在專家訪談中獲取了極具衝擊力的數據:
-
工作量重心的轉移: 專家指出,「在傳統的AI工作負載中,70-80%的算力消耗在推理本身(GPU)上;但在代理式推理中,這個比例反轉了,70-80%的工作量轉移到了CPU上。」
-
核心配比的暴增: 傳統的AI訓練中,每個GPU通常只需配備8-12個CPU核心;在基礎推理中,需要16-24個核心;而在代理式AI中,每個GPU需要配備80-120個CPU核心。 這相當於,同樣一顆GPU,在智能體場景下需要的CPU核心數是傳統訓練場景的5-10倍。
-
併發任務的壓力: 「一個代理(及其衍生出的每一個子代理)可能需要1-4個CPU核心,而一個複雜的任務可能需要生成10-100個子代理。」
這種底層邏輯的轉變,直接打破了過去「重GPU、輕CPU」的算力架構,為CPU市場打開了巨大的增量空間。

1700億美元的海量市場
基於上述邏輯,該行分析師對服務器CPU的總潛在市場(TAM)進行了重新測算。結果顯示,到2030年,該市場規模將達到約1700億美元。
這個龐大的數字是如何得出的?分析師採用了「自下而上」和「自上而下」兩種方法進行交叉驗證:
1. 自下而上(Bottom-up)測算: 分析師基於美國超大雲服務商(Hyperscalers)的加速器模型預測,到2027年,市場將出貨約2300萬個加速器(XPU)和約1000萬個頭節點CPU。隨着代理式AI的發展,到2030年,加速器出貨量將達到約4000萬個。 更重要的是,CPU與GPU的配比率將從目前的1:4,逐漸向1:2甚至1:1靠攏。此外,由於AI應用需要更高核心數和更高頻率的芯片,AI CPU的平均售價(ASP)將顯著提升。例如,英偉達的144核Grace CPU定價可能在3000至4000美元之間。量價齊升之下,僅AI CPU市場的規模就將達到1250億美元。
2. 自上而下(Top-down)測算: 分析師參考了英偉達對2030年AI總潛在市場(3萬億至4萬億美元)的預測。推算出2030年將有約4000萬個XPU出貨。假設每個XPU的平均ASP提升至3000美元,結合1:1或2:1的CPU配比率,同樣推導出AI CPU市場規模在1200億至2000億美元之間。
分析師將未來的CPU市場劃分為三個核心板塊:
-
傳統服務器市場: 保持穩定增長,預計到2030年出貨量約為4400萬台。
-
AI頭節點(Head Nodes): 與GPU機架捆綁,主要負責任務編排和優化GPU利用率。
-
AI獨立機架(Standalone): 純CPU服務器,專門用於處理代理式AI的工具調用和子代理併發任務。

市場的餅做大了,關鍵是怎麼分。
分析師明確給出排名:ARM是服務器CPU側最大受益者,其次是AMD,再次是英特爾——但三者均將受益。
ARM:份額從15%衝向40-45%
2025年,ARM架構在服務器CPU市場的單位份額約為15%。報告預計,到2030年,這一數字將升至40-45%;若以收入口徑計算,由於AI CPU的平均售價(ASP)更高,ARM的收入份額將進一步達到50-55%。
ARM的優勢在哪裏?
該行援引專家觀點:ARM架構功耗效率高出約30%,內存效率高出約20-30%,且憑藉更小的核心設計,在延遲和成本上具備明顯優勢。更關鍵的是,英偉達Grace、AWS Graviton 5(192核)、谷歌等頭部超大規模雲廠商的自研CPU,幾乎清一色採用ARM架構。
該行預計,到2030年,ARM將佔據頭節點CPU市場75%以上的份額。
但ARM也有短板。報告指出,ARM傳統上是單線程架構,同步多線程(SMT)能力是近年才逐步開發的功能;在高核心數場景下,核心間干擾和軟件兼容性問題依然是挑戰;此外,生態系統成熟度仍有待提升,部分軟件棧的完善可能要到2028年前後。
基於上述判斷,分析師將ARM的12個月目標價從175美元上調至245美元。截至報告發布前一日(5月4日),ARM股價報203.26美元,維持「買入」評級。

AMD:高核心數+多線程,AI最佳拍檔
AMD的優勢在於高核心數和多線程能力,這與智能體AI對CPU"又要快、又要多"的需求高度契合。
報告援引AMD在2025年11月分析師日的表態:AMD預計服務器CPU市場將從2025年的260億美元增長至2030年的約600億美元,其中AI驅動的CPU將佔2030年市場的約50%;AMD預計自身在總市場的份額將超過50%。
分析師目前對AMD 2030年的EPS預測為25.27美元,若市場按預期演進,修正後的2030年EPS可達28.14美元,上行空間約+11%。

英特爾:基礎盤穩固,但追趕壓力大
英特爾的處境相對複雜。
在傳統服務器市場,x86架構仍將保持約85%的份額,英特爾在工具調用、存儲優化等特定工作負載上仍具優勢。但在AI頭節點市場,英特爾的存在感正在被ARM快速壓縮。
瑞銀指出,英特爾正寄望於"Coral Rapids"產品線來縮小與AMD和ARM的差距,但目前來看,AMD和ARM在AI CPU市場的定位更為有利。
不過,英特爾也有一張獨特的牌:PC端的溢出效應。隨着智能體AI將更多任務推向本地設備執行(Anthropic的Claude Code已在採用這一策略),PC升級周期有望被催化,英特爾將從中受益。
該行對英特爾2030年EPS的修正上行空間約為+7%,是三家中最低的。

並非所有CPU都一樣:延遲vs吞吐量的取捨
報告還深入拆解了一個容易被忽視的細節:智能體AI對CPU的需求,並不是簡單地「核越多越好」。
超大規模雲廠商在硬件選擇上面臨一個根本性的取捨:
-
高核心數CPU:總吞吐量高,能效比好,但時鐘頻率低,延遲表現較差,且軟件擴展能力有限(大多數軟件無法高效利用數百個核心)
-
低核心數、高頻率CPU:延遲低、響應快,適合「頭節點」角色(負責編排調度、優化GPU利用率)
實際部署中,超大規模雲廠商傾向於採用「頭節點+大規模計算節點」的分層架構:前者負責低延遲的編排控制,後者負責高吞吐量的並行執行。
這意味着,能提供寬泛SKU組合(覆蓋不同核心數、頻率和功耗檔位)的廠商,比只押注單一「最強」配置的廠商更有競爭力。
瑞銀還指出,超大規模雲廠商的採購決策核心指標不是峯值性能,而是每瓦特可處理的事務數(transactions per watt),內存配置是首要設計變量。

雲端還是邊緣?一個懸而未決的變量
分析師另外提出了一個值得關注的不確定因素:雲端與邊緣的計算分工。
早期智能體部署幾乎完全依賴雲端,但越來越多的系統設計開始將計算推向本地設備——5到10個並行任務可以直接在本地文件和數據上運行,既減少了延遲,又節省了雲端算力成本。
瑞銀援引專家估算:本地執行的擴展,可能將雲端智能體工作負載所需的CPU容量減少約25%。
這意味着,智能體AI對數據中心CPU的拉動倍數,最終可能從5-8倍壓縮至約4倍。但與此同時,PC端的CPU需求將被同步拉升,AMD和英特爾均將受益。