CPU或許正在經歷一個「爆金幣」階段。
近期,CPU成為科技圈「頂流」——英偉達單獨出售CPU、阿里雲強調CPU與AI芯片協同,還有兩大CPU巨頭(Intel+AMD)在今年2—5月對部分CPU系列(尤其服務器和高端消費級)進行了多輪漲價,且都上調市場預期。行業人士分析認為,這是AI從大模型訓練轉向智能體 (Agentic AI) 推理的必然結果。
《中國經營報》記者注意到,在這輪CPU「爆金幣」階段,英偉達最近的動作具有信號意義:一是英偉達Vera CPU已於5月18日正式完成首批交付,客戶包括Anthropic、OpenAI、SpaceX AI(即xAI)和甲骨文雲基礎設施(OCI);二是英偉達、微軟和Arm在台北國際電腦展(COMPUTEX Taipei)前夕預告「PC新時代」的到來,外界猜測英偉達將發布面向消費者的基於Arm架構的CPU。
「主要因為智能體。」行業機構Omdia人工智能首席分析師蘇廉節這樣解釋近期CPU大火的原因。「智能體的絕大部分工作是任務解讀、解構、編排和分配,這些工作都是有優先次序的,需要CPU這種串行計算的芯片邏輯。」他說。
這和AMD董事會主席、CEO蘇姿豐的觀點類似。日前,蘇姿豐在上海的AMD AI開發者日表示,AI正在進入Agent時代,Agent需要自主拆解任務、規劃步驟、調用外部工具、處理數據、檢查結果,這些編排和調度工作全部由CPU完成,GPU只負責其中「調用模型做推理」的環節。在她看來,數據中心裏CPU與GPU的配比正在從過去的1:4甚至1:8,向1:1靠攏。
中金證券在最近的一份研報中指出,基於GPU:CPU=1:1配比估計下,測算至2030年全球CPU市場規模將超1300億美元。
CPU的技術升級趨勢
事實上,早在兩年多前由芯片大神Jim Keller創辦的AI芯片初創Tenstorrent就意識到CPU對於大模型的重要性,只不過他們採用的是RISC-V架構。
根據當時《電子工程專輯》對Tenstorrent首席CPU架構師練維漢的採訪,他認為今後AI模型的計算,不只是矩陣型運算,還有很多需要CPU來做,比如大語言模型的存取非常破碎、混亂,而這是CPU最擅長做的。
「大語言模型有所謂的KV cache,它是給語言模型的一個情景,比如說我談狗的時候,是你的狗還是我的狗?所以說先把token(詞元)碰到KV-cache裏,它去找聊天記錄,像這樣的項目非常多,每次開始一個對話,它就做這樣的事情。」練維漢表示,這是一種不同尋常的隨機存取,所以CPU是個好選擇,未來這樣的情況預估會越來越多,所以CPU+AI引擎是一種好的異構組合。
蘇姿豐認為,服務器CPU的需求大致可分成三類:第一類是傳統的通用計算需求,增速相對溫和;第二類是作為GPU頭節點的CPU,在數據中心的服務器集群裏,通常需要CPU來管理和調度旁邊的GPU運算,這顆CPU就是「頭節點」;第三類是專門為Agent工作流服務的CPU,負責任務編排、數據處理和工具調用。
除了Agentic AI,強化學習(RL)也帶來了對CPU需求的提升。比如,英偉達在官方新聞稿中就表示,Vera CPU是全球首款專為Agentic AI和強化學習時代量身打造的處理器。
中信建投在人工智能行業CPU系列報告中提到,強化學習架構中Actor(環境步進、推理調用)100%運行在CPU,Learner(優化器更新)運行在GPU,CPU成為RL訓練的核心調度層。
「現在的CPU架構隨着摩爾定律持續迭代,就能應付接下來的訴求。大廠都會在CPU里加一些利於推理的計算邏輯。」蘇廉節表示,目前大部分的資源都被安排到GPU ,且CPU可以是X86架構,也可以是更節能、更靈活的Arm或是RISC-V架構,生態成熟。
前述中金證券研報指出,從技術發展趨勢看,作為新操作系統的「調度器」CPU的升級趨勢主要有:一是更強的單核性能來降低單次推理的延遲,二是更大的內存帶寬和更強的I/O能力來調度更長的上下文以及管理海量的數據,三是更多核心數據來支持高併發查詢及虛擬化。
今年已有近200億美元的CPU營收
英偉達進軍CPU市場的時機,恰逢AI應用從模型訓練向推理及智能體範式加速轉型。這一趨勢已令此前深陷困境的英特爾出現復甦跡象,Arm公司也於今年早些時候親自下場,推出其史上首款自研CPU芯片,專門面向推理和智能體AI工作。
視角再回到英偉達CPU上。據了解,Vera於今年3月正式發布,是英偉達史上首款獨立售賣的CPU產品,採用Arm架構,配備88顆自研的Olympus核心,為編譯器、運行時引擎、分析流水線、智能體工具和編排服務提供高性能;採用第二代低功耗內存子系統,該系統基於LPDDR5X內存構建,帶寬最高可達1.2 TB/s——與通用CPU相比,帶寬提升一倍,功耗降低一半。
在產品形態上,英偉達發布了一款全新的Vera CPU機架,該機架集成了256個液冷式Vera處理器,可支持超過22500個併發CPU環境同時運行;Vera機架基於NVIDIA MGX模塊化參考架構打造;也可作為NVIDIA Vera Rubin NVL72平台的一部分,Vera通過NVIDIA NVLink-C2C互連技術與英偉達顯卡配對。
此外,英偉達還推出了以Vera作為主機處理器的全新參考設計,用於構建NVIDIA HGX Rubin NVL8系統,Vera系統合作伙伴提供雙插槽和單插槽CPU服務器配置;在所有配置下,Vera系統集成了NVIDIA ConnectX SuperNIC網卡和NVIDIA BlueField-4數據處理單元(DPU),以實現加速網絡、存儲和安全功能。
目前,英偉達Vera 已全面量產,將於今年下半年在合作伙伴處開售。據悉,與英偉達合作部署Vera的頭部超大規模雲服務商包括阿里雲、CoreWeave、Meta和甲骨文雲基礎設施,還有戴爾科技、慧與、聯想、超微等系統製造商。
英偉達首席財務官Colette Kress在最新的財報電話會議上表示,今年在CPU業務上已有近200億美元的營收可見度,而Vera打開了一個全新的、規模高達2000億美元的潛在市場。
不少分析師認為,200億美元這一數字不宜直接與傳統CPU營收口徑對標,可能源於英偉達以機架為單位而非單顆芯片出售CPU的計價方式。
摩根士丹利分析師Joseph Moore表示,200億美元的目標將使英偉達「處於市場領導地位的臨界點」,而英偉達多年來積累的供應鏈議價能力和採購優先級,將使其在產能受限的環境下依然保持較強競爭力。
(文章來源:中國經營報)