服務器CPU,顛覆前夜?

藍鯨財經
昨天

文|半導體產業縱橫

當憑藉驅動AI的專用GPU賺得盆滿鉢滿的英偉達宣佈「看好CPU賽道的潛力。」當Vera Rubin平台帶着36顆Vera CPU與72顆GPU的配置亮相,當國際機構集體預判CPU供需缺口將持續擴大,一個明確的信號已然浮現:AI算力的核心敘事邏輯,正在從「GPU單極主導」向「CPU+GPU協同共生」演進。

 CPU的重要性,不亞於GPU

黃仁勳對CPU的押注,絕非臨時起意,在過去很長一段時間中,英偉達都對PC市場充滿渴望。

早在2011 年的CES上,英偉達正式公布Project Denver(丹佛計劃),宣佈基於 ARM 架構開發定製CPU 核心。之後在2014年與2018年,英偉達陸續發布移動處理器Tegra K1、用於自動駕駛與邊緣計算Carmel CPU 核心等。

2021年4月英偉達發布基於Arm架構的Grace CPU,標誌着這家GPU巨頭正式殺入服務器CPU戰場。Grace並非傳統意義上的通用處理器,而是專為AI、HPC(高性能計算)和大規模數據處理而設計的「加速型CPU」。

近日,Meta宣佈與英偉達公司達成新的採購協議,將購買數百萬顆英偉達下一代Vera Rubin圖形處理器和同等數量的Grace中央處理器,以支持其人工智能發展戰略。據悉,Meta已經是英偉達最大的客戶之一,多年來一直在使用英偉達的GPU,但這項新協議表明兩家公司將建立更深層次的合作伙伴關係。值得注意的是,Meta還承諾大量採購英偉達的Grace CPU,並將其作為獨立芯片部署,而不是與GPU配合使用。

英偉達表示,Meta將成為首家獨立部署Grace CPU的公司,從明年開始,還將部署下一代Vera CPU。值得注意的是,Vera CPU是英偉達推出的新一代AI芯片,屬於其自研Arm架構CPU系列,於2026年1月6日在CES 2026上官宣,並預計於2026年3月16日至19日在GTC 2026上正式發布,計劃於2026年下半年開始向微軟等首批客戶交付。該芯片旨在為下一代大模型訓練與推理提供支持 。

在此前的拉斯維加斯消費電子展上,黃仁勳還表示:"英偉達躋身全球頂級CPU製造商行列不會令人意外。"

在AI算力被GPU刷屏的這幾年,市場很容易形成一個慣性認知:AI = GPU。但走到2026年,一個被雲廠商、大模型公司用真金白銀驗證的結論正在成為共識:CPU在數據中心的重要性,絲毫不亞於GPU。

為什麼過去幾年行業只追捧GPU,卻把CPU當成 「配角」?核心原因很簡單:AI還處在 「訓練為王」 的階段。2023—2025年,行業重心是把大模型 「訓出來」,比拼的是極致並行算力、矩陣乘法效率,GPU憑藉架構優勢,天然成為訓練階段的絕對主角。此時CPU只承擔基礎調度、數據搬運等輔助工作,自然不被輿論聚焦。

但從2025下半年到2026年,AI產業完成了一次關鍵範式切換:從訓練為主,轉向推理、執行、規模化落地為主。Agent、RAG、工具調用、多模態交互、強化學習環境搭建…… 這些商用化場景,不再是單純的並行計算,而是大量邏輯判斷、串行執行、系統調度、I/O 管控、內存調度、任務分發。這些恰恰是GPU的短板、CPU的主場。

行業數據已經給出答案:在典型 Agent 工作流中,CPU處理延遲佔比高達90%,成為端到端性能的頭號瓶頸。過去「堆 GPU 就能提效」 的邏輯徹底失效 ——CPU跟不上,GPU利用率就上不去;CPU規格不夠,集羣就開不滿。2026 年開年Intel、AMD服務器CPU集體漲價、產能被搶空,正是這一趨勢的直接體現。

目前英特爾和AMD的CPU普遍缺貨,服務器CPU交貨周期最長可達6個月,消費級CPU也面臨延遲和漲價。英偉達選在這個節點重兵投入服務器CPU,既是補全自身全棧算力版圖,也是直擊 x86 陣營的供給軟肋。它的邏輯非常清晰:

不做通用CPU,而是為AI集羣量身定製,和GPU、DPU、高速互聯深度協同;

解決行業最痛的問題:CPU瓶頸導致GPU利用率上不去、集羣跑不滿;

用一體化方案,對沖當前x86 CPU缺貨、交付不穩定的風險。

這也意味着,數據中心算力競爭正式從「單芯片比拼」 進入 「全系統較量」。

CPU缺貨了,格局也變了

再看一下當前服務器CPU市場的競爭格局。

過去二十年,服務器CPU市場幾乎被英特爾和AMD牢牢掌控。憑藉成熟的x86指令集、龐大的軟件生態以及與操作系統、中間件的高度兼容性,x86架構成為企業級市場的默認選擇。尤其在通用計算、數據庫、虛擬化等場景中,x86 CPU的綜合優勢無可替代。

但這一雙寡頭格局正加速生變,英特爾長期以來的主導地位持續承壓,AMD 則憑藉技術突破實現份額穩步攀升。

上圖顯示,截至2025年,AMD在服務器市場的出貨份額已接近30%,而英特爾雖仍佔據主導地位,但份額較高峯期有所回落。這一變化源於多重產業因素,而非單一技術優劣。

業內人士向半導體產業縱橫表示:

首先,客戶需求正在分化。

超大規模雲服務商對高核數、高能效、高I/O帶寬的需求快速上升。AMD自EPYC系列起採用Chiplet(小芯片)架構,結合台積電先進製程,在96核以上產品上實現較快落地,契合了部分雲廠商對「每瓦性能」和橫向擴展能力的偏好。但這並不意味着AMD毫無短板。該人士表示:「AMD的Chiplet小芯片架構,雖然能快速堆核心數,但不同小芯片之間的通信延遲偏高,這是它一直以來的問題。」業內人士補充道,而英特爾的優勢恰恰在這裏——核電通信延遲低,再加上多年積累的軟件和硬件生態,適配性更好,這也是它在當前AI浪潮中能穩住份額的關鍵。

其次,價格策略,則成為AMD撬動市場的另一把「鑰匙」。

「整體來看,AMD的服務器CPU價格會比英特爾略低,尤其是在渠道市場,AMD的策略更激進。」業內人士透露,AMD對老型號產品會給出大幅折扣,導致市場上充斥着高性價比的舊款AMD CPU,而英特爾則堅持穩健的價格控制,不輕易降價。這種價格差異,也讓不同客戶羣體做出了不同選擇。互聯網大廠和主流服務器廠商,更看重技術迭代,會緊跟英特爾的新品節奏,優先採購最新款或上一代產品;而廣大中小客戶、渠道裝機市場,更在意性價比,大量選用AMD的舊型號產品。除此之外,工控、IoT、邊緣端等細分領域,雖有部分客戶仍在使用老舊產品,但這部分市場對整體格局的影響相對有限。

最後,供應鏈策略差異也正在顯現。

作為長期佔據行業龍頭的英特爾,曾憑藉自主製造體系(IDM模式)穩穩握住技術主動權,但2021年前後,其製程工藝的迭代突然「慢了下來」。從而導致新品推出節奏明顯脫節,比AMD慢了半拍甚至一拍,很多客戶等不及,就轉頭選擇了AMD的新品。」業內人士解釋道。

反觀AMD,走了一條與英特爾截然不同的路——放棄自主製造,全部交由台積電代工。這一選擇恰好踩中了先進製程的風口,從7nm到如今的3nm,AMD緊跟台積電的工藝節奏,產品性能和能效比一路提升。不過近幾年,英特爾 18A 製程工藝日趨成熟,正逐步削弱製程層面帶來的性能差距。

對於市場普遍關注的「未來5-10年,AMD是否能拿下半數的數據中心x86 CPU市場」的疑問,業內人士給出了明確答案:「大概率不會。」在他看來,雙方的優勢領域已經形成互補,且難以相互替代。

「AMD的高核心數適合雲計算、大數據這類規模化場景,而英特爾的低延遲和成熟生態,在AI、金融科技等高端領域不可替代。」他進一步分析,如今英特爾的製程已經基本回歸先進水平,短板主要在產品設計上,目前也在不斷優化產品理念,應對AMD的競爭;而AMD則需要解決延遲問題,同時補齊軟件生態的短板,才能進一步提升份額。

CPU市場的變量,不止英偉達

除卻英偉達,CPU底層架構的博弈正悄然重塑服務器市場的長期格局。

此前x86架構在全球服務器CPU市場佔有率同樣高達90%,然而根據市場研究機構Dell'Oro Group最新報告,2025年第二季度,ARM架構處理器在服務器CPU市場份額已達到25%,相比去年同期的15% 大幅提升了10個百分點。 這一顯著增長主要得益於英偉達基於ARM架構的Grace平台的大規模交付,以及大型科技企業定製芯片的加速部署。

比如,亞馬遜網絡服務憑藉其Graviton系列開創了超大規模ARM服務器處理器,首次發布於2018年。該公司認識到,在其數據中心運行的大部分工作負載不需要x86處理器提供的最大單線程性能,但將從改進的能效和成本效益中獲益巨大。到2024年,AWS表示其大約一半的新CPU部署使用Graviton處理器而不是x86芯片。

谷歌隨後推出了其Axion處理器,於2024年宣佈,聲稱與同類x86處理器相比功耗降低百分之六十,同時為典型雲工作負載提供同等性能。

究其原因,首先,傳統x86架構在高負載下往往伴隨顯著的能源消耗,而ARM通過精簡指令集與更高效的芯片設計,在同等算力下大幅降低單位能耗,為雲服務提供商節省了持續性的運營成本。其次,其靈活的許可模式則徹底打破了芯片授權的壟斷邏輯——雲廠商無需支付高額授權費用,即可自由定製處理器架構,深度適配自身工作負載,將算力從"通用適配"升級為"場景定製"。這種模式不僅重構了芯片創新的參與門檻,更讓雲服務從"購買硬件"轉向"定義算力",真正實現按需優化。最後,低成本優勢則進一步消除了算力普及的障礙,使雲服務在經濟性上更具競爭力。

不止是ARM架構,基於 RISC-V 架構的服務器 CPU 也在迅速「破圈」。RISC-V架構有着開源、指令精簡和可擴展的優勢,在注重能效比的物聯網領域收穫頗豐。不過,這並不意味着RISC-V無法進軍有更高性能要求的PC和服務器市場。

關於RISC-V 架構的優勢,筆者總結主要有四點:

第一點,它是開源的,這意味着它自主可控。第二點,它是可定製化的,如此便十分契合專用服務器的定製化需求。第三點,它的成本更低,目前RISC-V IP核的授權費和版稅只有ARM的1/3-1/4。如果採用RISC-V方案,能很大程度降低芯片、服務器廠商的成本。第四點,RISC-V存在一些獨特的性能優勢,比如其有能力在單位面積上提供更高性能和核數,這使其在有着高效能需求的AI等應用中更加高效。

如今,已有多家公司的RISC-V架構服務器CPU芯片亮相。比如阿里巴巴的玄鐵RISC-V CPU,以及睿思芯科的全自研高性能RISC-V服務器芯片等。

阿里雲無影事業部總裁張獻濤曾表示「我覺得經過5-8年的發展,未來在服務器裏面的大規模應用應該是不成問題的。很多公司對它的期待很高,一定會加速進程往前發展的。RISC-V架構從低功耗IoT終端大規模應用到數據中心,大概5-8年內就能實現。」

微核芯CEO郇丹丹表示高性能計算場景纔是打開RISC-V市場空間的關鍵。「過去RISC-V大多都是面向AIoT領域,低成本低性能領域已經是紅海市場,作為新興指令集的RISC-V產業要想發展壯大,只有伴隨着數據中心在高性能領域(服務器、AI計算)的新興應用成長才是打開市場空間的關鍵。」

如今,英偉達攜Grace、Vera CPU重兵入局,ARM架構憑高能效與定製化優勢快速崛起,RISC-V則以開源之力打破壟斷壁壘,曾經由x86雙寡頭主導的格局被徹底打破。隨着AI產業從「訓練為王」轉向「推理落地」,CPU的核心價值愈發凸顯,算力競爭也從單芯片比拼升級為全系統較量。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10