英偉達自研CPU Vera已完成對Anthropic、OpenAI、SpaceX AI及甲骨文雲的首批交付。Vera旨在滿足Agent AI對CPU的需求,黃仁勳將Vera定位為公司"下一個數十億美元級業務"。甲骨文已表態,計劃於2026年起部署數十萬顆英偉達Vera CPU。
英偉達將其自研CPU Vera交付給全球頂尖AI實驗室,標誌着這家芯片巨頭在GPU霸主地位之外,正式開闢新的硬件戰線。
英偉達副總裁Ian Buck於上周五親手將首批Vera CPU系統送抵Anthropic、OpenAI及SpaceXAI三家機構,並於本周一完成對甲骨文雲基礎設施(OCI)的交付。
這是Vera CPU從今年3月GTC大會宣佈至今,首次進入客戶生產環境。英偉達CEO黃仁勳在GTC發布時將Vera定位為公司"下一個數十億美元級業務"。
OCI方面已明確表態,計劃於2026年起部署數十萬顆英偉達Vera CPU,成為首家在超大規模環境中部署Vera的雲服務提供商。
為何Agent AI需要一顆新的CPU
英偉達的核心論點在於:Agent AI的工作負載與GPU訓練和推理有本質區別。
當AI模型從"回答問題"轉變為"執行任務",大量併發的調度、工具調用、代碼生成、長上下文檢索等操作隨之湧現——這些均屬CPU密集型工作,並非GPU所長。Ian Buck在OCI交付現場表示:
"當AI模型被提問時,答案往往不是現成的,模型實際上需要生成Python代碼才能得出正確答案,這正是我們看到CPU需求急劇攀升的原因。"
Vera搭載88顆英偉達自研Olympus核心,內存帶寬達1.2 TB/s,滿載情況下單核性能較前代提升50%。英偉達將其定位為專為高吞吐推理、Agent沙箱及強化學習工作負載設計的新一類CPU。
逐站交付:從舊金山到硅谷
上周五的首站交付在Anthropic位於舊金山SoMa區的辦公室完成。Anthropic計算負責人James Bradbury接收了系統,並與Buck就Vera的架構特性進行了深入交流。Bradbury表示:
"擴展計算是模型成長的重要加速器,我們很高興看到Vera在解決Agent工作負載方面展現出成為生態系統重要組成部分的潛力。"
在OpenAI位於Mission Bay的總部,計算基礎設施負責人Sachin Katti接收了系統。Buck在交流中甚至當場取出螺絲刀,打開機箱蓋,向對方展示系統內部構造。
當天最後一站是SpaceXAI位於帕洛阿爾託的辦公室。英偉達團隊向馬斯克詳細介紹了系統內部結構。SpaceXAI正評估將Vera用於強化學習工作負載及驅動其訓練架構的基於Agent的仿真流水線。
OCI領跑超大規模部署
本周一在甲骨文AI客戶中心,OCI產品管理負責人Karan Batta及首席客戶與合作伙伴成功官Gary Miller對Vera系統進行了現場參觀。Batta明確了OCI的部署意圖:
"OCI計劃從2026年起部署數十萬顆英偉達Vera CPU,因為Agent AI需要大規模的持續性能。Vera的架構專為高吞吐推理工作負載而設計,能夠提供OCI為下一代企業AI提供動力所需的效率、密度和佔用空間。"
英偉達方面表示,OCI是首家在超大規模層面部署Vera的雲服務提供商。
Miller則着眼於企業客戶側的驗證需求,表示團隊迫切希望讓客戶在該中心對Vera展開測試與定製,以充分釋放其在Agent AI場景下的潛力。
Vera在英偉達整體架構中的定位
Vera並非孤立產品,而是英偉達"極致協同設計"體系的核心組件之一,與Rubin GPU、BlueField 4 DPU、Spectrum-X網絡及MGX機架架構共同構成完整的AI工廠基礎設施。
在Vera Rubin NVL72配置中,Vera通過第二代NVLink-C2C與兩顆Rubin GPU相連,形成統一內存架構,使加速計算資源保持高效利用。
英偉達表示,Vera的高速核心與互連設計能夠以傳統基礎設施兩倍的能效,完成向GPU饋送數據所需的調度、控制與數據搬移工作。
對於投資者而言,Vera的正式交付提供了一個可追蹤的商業里程碑:從OCI已公開承諾的"數十萬顆"訂單規模,到AI頭部實驗室的同步採用,英偉達正在將Agent AI對CPU的需求轉化為可見的新增營收來源。