(信息來源:semiengineering)
過去十年,數據中心處理器市場經歷了兩次重大轉變。
過去,所有數據中心的計算都是 x86 架構,其中超過 90% 都來自英特爾。GPU 於2016 年首次出現在數據中心(Pascal GPU)。
現在,大多數計算都在 GPU 上完成。AMD正努力在 x86 市場超越英特爾,而基於 Arm 的 CPU 則在 NVIDIA 和超大規模廠商的推動下快速增長。
AMD 正在數據中心 CPU 領域取代英特爾
AMD 正在迅速搶佔英特爾在 x86 數據中心處理器領域的份額。
如上圖所示,AMD 的份額目前爲40%,而 2018 年幾乎爲零。這是因爲:
1. AMD 總裁兼首席執行官蘇姿豐;
2. 蘇姿豐決定轉投臺積電;
3. 其團隊的出色執行力;
4. 英特爾失去半導體制程技術主導地位。
這些潛在因素不太可能很快改變,因此 AMD 很可能在 2026 年成爲數據中心最大的 x86 CPU 供應商。(英特爾的 18A 在紙面上看起來可行,但該公司似乎在擴展節點和相關的財務限制方面遇到困難)。
AMD 2025 年第一季度數據中心部門的收入爲 37 億美元,包括 CPU 和 GPU。最佳估計是,其中大部分是服務器 CPU,2025 年第一季度的收入約爲25 億至 30 億美元。
就單位數量而言,2024 年第三季度,AMD和英特爾的服務器 CPU 總出貨量爲 550 萬臺。這意味着年均出貨量約爲 2200 萬臺。排名前四的超大規模廠商約佔其中的一半,即每家每年約 250 萬臺。(注:不同 CPU 的平均售價可能差異很大。例如,AMD 服務器 CPU 的售價幾乎是英特爾的兩倍。美元收入是更好的指標,但爲了與 Arm 進行比較,我們只有單位數量信息。)
超大規模企業購買了大約一半的 x86 數據中心處理器,並且它們全部都使用基於 Arm 的 CPU
Arm 高級副總裁兼數據中心基礎設施總經理 Mohamed Awad 在 3 月份表示,到 2024 年底,基於 Arm 的CPU 在數據中心的份額約爲 15%。但他預計,到 2025 年底,Arm 的 CPU 份額將增長到接近50%——這大概是出貨量份額。(下文將介紹 Arm 的份額可能達到 50%,但要到 2020 年後期)。
這是因爲另外兩個重大轉變。首先,超大規模計算廠商正在爲通用應用設計自己的 CPU。其次,NVIDIA 正在設計自己的 CPU 用於 GPU 協同處理。
大約一半的數據中心 CPU/GPU 購買是由頂級超大規模企業進行的。
Arm 的 Mohamed 表示,超大規模計算廠商構建自己的 CPU 的主要動機是爲了針對特定工作負載進行優化,從而獲得更好的功耗/性能。削減英特爾/AMD 的利潤率是一個考慮因素,但僅憑這一點可能不足以證明這種轉變的合理性。
當然,超大規模企業運行的大部分工作負載是其客戶的軟件,這些軟件目前主要針對 x86 進行了優化。Arm 處理器將首先用於超大規模企業控制的工作負載——搜索、照片、購物、Facebook、法學碩士 (LLM) 等。但看看超大規模企業的網站,他們正在大力推廣他們的 Arm 處理器,所以這種情況將會改變。
亞馬遜是數據中心中首款採用Arm架構的CPU。Graviton自2018年起已進入第四代。截至2024年中期,亞馬遜已生產了超過200萬顆Graviton。假設2024年生產了50萬顆Graviton,這將約佔x86 CPU總採購量的20%。Graviton在其雲中用作獨立計算實例,並與GPU配合使用。亞馬遜首席執行官安迪·賈西(Andy Jassy)於6月30日在CNBC上表示,Graviton的性價比比x86高出30%至40%,而且功耗更低。
谷歌於 2024 年 4 月發佈了 Axion 處理器。谷歌雲網站聲稱“Axion 提供業界領先的性能和能源效率”,具體來說“與同類當前一代基於 x86的實例相比,性能提高了 50%,能源效率提高了 60%”。
微軟於 2023 年發佈了 Azure Cobalt CPU(以及 Azure Maia AI 加速器)。微軟聲稱與 x86 相比,其性能可節省約 30%。
節省成本固然重要,但電力最終將成爲最重要的因素。在爲 Frontier LLM 模型構建日益龐大的 AI 數據中心時,電力是最大的挑戰。
所有這些 Arm-CPU 都可供雲端客戶使用,如果性價比優於 x86,那麼隨着時間的推移,客戶會將他們的工作負載從 x86 轉移到 Arm。
今年早些時候,Meta和 Arm 宣佈他們正在研發 Arm 數據中心 CPU。
NVIDIA 已轉向使用Arm-CPU 控制其 GPU
2022 年,NVIDIA 開發了 Grace,這是其首款基於 Arm 的數據中心 CPU。它最初與 Hopper GPU 一起部署,今年將與 Blackwell GPU 一起部署。NVIDIA 在 NVLink72 配置下不支持 Blackwell 的 x86 架構。由於 NVLink72 性能最佳,因此大多數企業都會選擇 NVLink72 進行部署。
將 Grace CPU 與英特爾至強鉑金 8480+ 和 AMD EPYC 9654 進行比較,NVIDIA 聲稱 Grace 在大多數非 AI 基準測試中的相對性能提高了 1.2 倍到 2.4 倍,並且能效提高了 1.5 倍到 3.0 倍。
摩根大通預計 2025 年Blackwell GPU 的出貨量爲 500 萬個(2026年爲 750 萬個 Blackwell/Rubin 單元)。兩個 Blackwell GPU 由 1 個Grace CPU 控制,這意味着 2025 年 Grace CPU 的出貨量將達到 ~250 萬個。一位數據中心基礎設施行業的專家表示,對於 AI 工作負載,x86 服務器僅用於運行控制平面操作,因此每 100,000 個 GPU 將需要 5到 10 個 x86 CPU 機架。一個 CPU 機架可容納 42 個 1U 服務器,每個 1U 服務器可以配備 1 或 2 個 x86。計算一下,這意味着每 100,000 個 GPU 需要 210 到 840 個 x86 CPU,而每 100,000 個 GPU 有 50,000 個Grace CPU。因此,對於 AI 工作負載,Grace CPU 的數量是 x86 的 50 倍到 100 倍。
此前,我們看到 x86 數據中心的出貨量約爲 2200 萬臺。考慮到超大規模廠商生產的 250 萬臺 Grace CPU 和大約 100 萬臺基於 Arm 的 CPU,Arm 2025 年的市場份額約爲 15%,而不是 Arm 預測的近50%。
到 2030 年,Arm 的份額將會增加,但即便如此,x86 似乎仍將保持主導地位
NVIDIA 的路線圖於 3 月份在 GTC 2025 大會上發佈,展示了一款名爲 Vera 的全新 Arm 處理器,它將與 Rubin GPU 以及 Feynman GPU 配對。因此,NVIDIA 仍將堅持 Arm+GPU 的路線。
連接到 GPU 的 CPU 的增長速度將遠超其他數據中心 CPU。除非 AMD 的 GPU 份額快速增長(因爲 AMD 會將其 GPU 連接到 x86 CPU),否則這些 CPU 將主要基於 Arm。
數據中心中其餘未直接連接到 GPU 的CPU 有一半被交付給超大規模計算廠商——這些廠商都採用Arm CPU。這些廠商的性價比更高,很可能會以更低的價格將客戶轉移到 Arm。
麥肯錫今年 4 月發佈了對 2030 年數據中心增長的預測。
到 2030 年,以瓦特爲單位的人工智能工作負載將增長 3.5 倍。非人工智能工作負載將增長 1.7 倍。
如果2025年非AI工作負載由約2200萬個x86 CPU和約100萬個Arm CPU完成,並且計算單元數量增長速度與GW(千兆字節)一樣快(粗略估計),那麼2030年的計算單元數量將約爲3700萬個x86 CPU和約200萬個Arm CPU。目前,我們假設超大規模計算企業不會將其CPU配置轉向Arm。如果前四大超大規模計算企業(佔比約一半)將50%的CPU轉向Arm,那麼到2030年,計算單元數量將約爲2900萬個x86 CPU和約1000萬個Arm CPU。考慮到超大規模計算企業的投入以及他們在網站上的宣傳力度,後一種情況似乎更有可能出現。
如果 2025 年非 AI 工作負載由約 500 萬個 GPU 完成,那麼到2030 年,這一需求將擴展到約 1800 萬個 GPU,屆時將需要約 900 萬個 Arm CPU。(根據GPU 的計算方式,實際 Arm CPU 數量可能會更少)。
因此,到 2030 年,數據中心CPU 總數將達到約 4800 萬個,其中 Arm 的份額將高達 1900 萬個。這些數字雖然粗略,但足以表明,未來十年內,Arm 必將挑戰數據中心 CPU 的主導地位。推動這一趨勢的兩個主要因素是:1)超大規模企業將雲端工作負載從 x86 轉移到 Arm;2)基於 Nvidia 的 AI 數據中心使用的Arm CPU 數量將是 x86 的 50 到 100 倍。
美元份額更重要,但我們沒有Arm的平均售價數據。x86的美元份額很可能會高於其出貨量份額,但趨勢仍在朝着Arm份額隨着時間的推移穩步增長的方向發展。AMD從Nvidia手中奪取AI領域的大量份額將減緩Arm的份額增長,因爲AMD很可能會使用x86而不是Arm進行GPU協同處理。