谷歌雲發布兩款第八代TPU芯片:8T主攻訓練、8I面向推理場景,核心指向降低推理成本與支撐AI智能體規模化,預計於今年晚些時候上市供應;並推出Gemini企業級智能體平台,補齊記憶與協作短板,切入自動化入口。在推理需求爆發背景下,谷歌正以算力重構+應用層卡位,正面衝擊英偉達與OpenAI主導格局。
Alphabet旗下谷歌雲在年度開發者大會上密集出牌,同步推出新一代自研芯片與企業級AI智能體工具,在硬件和軟件兩條戰線上同時向英偉達、OpenAI及Anthropic發起挑戰。
當地時間周三,谷歌雲在拉斯維加斯舉行的Google Cloud Next 2026大會上,發布了第八代張量處理器(TPU)的兩款新品:專為AI模型訓練設計的TPU 8T,以及專為推理(inference)階段優化的TPU 8i,預計於今年晚些時候上市供應。這是谷歌首次將訓練與推理任務拆分至獨立芯片,標誌着其AI硬件戰略的重大轉向。
與此同時,谷歌還推出了Gemini Enterprise Agent Platform等一系列AI智能體開發工具,直接瞄準企業自動化市場。
新芯片的發布正值AI推理需求急速擴張之際。谷歌雲計算與AI基礎設施副總裁Mark Lohmeyer表示:"關鍵在於如何以最低的每筆交易成本實現最低的響應延遲。交易量正在大幅攀升,而每筆交易的成本必須大幅下降,才能實現規模化。"兩款新芯片將於今年晚些時候正式上線。
訓練與推理分離,芯片性能大幅躍升
谷歌此次將第八代TPU拆分為兩款獨立產品,是對AI工作負載日益分化趨勢的直接回應。
谷歌高級副總裁兼AI與基礎設施首席技術官Amin Vahdat在博客中寫道:"隨着AI智能體的興起,我們判斷業界將受益於針對訓練和推理各自需求專門優化的芯片。"
TPU 8t專為AI模型訓練優化,號稱能夠"將前沿模型開發周期從數月壓縮至數周"。
在性能層面,TPU 8t的每瓦性能較上一代提升124%,TPU 8i則提升117%。與去年11月發布的第七代Ironwood TPU相比,TPU 8t在同等價格下性能提升2.8倍,TPU 8i的性能則提升80%。
訓練芯片TPU 8t最多可將9600塊芯片組合成一套系統,谷歌表示,在部署如此大規模系統時,電力已成為數據中心的核心制約因素,更高的能效比因此至關重要。
TPU 8i則主要面向推理場景,適用於運行AI模型及處理AI智能體任務。其架構設計重點在於大容量片上存儲。每塊芯片集成384MB的靜態隨機存取存儲器(SRAM),是上一代Ironwood的三倍。
兩款芯片均計劃於2026年晚些時候正式對外供應。
Alphabet首席執行官桑達爾·皮查伊在博客中表示,這一架構旨在"以具有成本效益的方式,提供同時運行數百萬個智能體所需的大規模吞吐量和低延遲"。片上存儲的增加意味着芯片無需頻繁從外部調取數據,對於需要多步驟推理的AI任務尤為關鍵。
AI智能體平台全面鋪開,直指OpenAI與Anthropic
在軟件層面,谷歌此次發布了一套完整的企業AI智能體工具鏈,正面迎戰OpenAI和Anthropic在企業市場的佈局。
據彭博報道,多位初創公司創始人表示,硅谷工程師在AI編程工具的選擇上通常在Anthropic的Claude Code與OpenAI的Codex之間切換,谷歌往往不在考慮之列——這一現狀令谷歌高層深感憂慮。
谷歌雲CEO Thomas Kurian在博客中表示:"這不是提供可拼湊在一起的單項服務,而是提供一個全面的創新基礎骨架。"
新推出的Gemini Enterprise Agent Platform新增了Memory Bank和Memory Profile功能,幫助智能體記住與用戶的歷史交互,彌補早期AI工具的記憶短板;Agent Simulation功能則允許開發者在上線前對工具進行更充分的測試。
谷歌還推出了協作平台Projects,整合來自Workspace、微軟OneDrive及企業內部聊天工具的信息,為智能體提供必要的上下文支持。此外,谷歌還發布了面向普通員工的Gemini Enterprise應用,定位為"每位員工的AI前台",用戶無需編寫任何代碼即可創建智能體。
TPU採用加速,英偉達合作並行推進
儘管谷歌在自研芯片上持續加碼,但其與英偉達的合作關係並未中斷。
Mark Lohmeyer表示,谷歌計劃成為今年下半年英偉達新一代芯片設計的首批部署方之一,同時將繼續為希望使用英偉達系統的客戶提供相關服務。
與此同時,谷歌TPU的商業採用正在提速。
對沖基金Citadel Securities已基於谷歌TPU構建量化研究軟件,美國能源部旗下全部17個國家實驗室均在使用基於TPU構建的AI協作科學家軟件。Meta已與谷歌簽署一項多年期、數十億美元的TPU使用協議,AI新貴Anthropic也已承諾使用數吉瓦級別的谷歌TPU算力。
DA Davidson分析師去年9月估計,TPU業務與谷歌DeepMind AI部門合計價值約9000億美元。
值得注意的是,谷歌並未將新芯片的性能與英偉達產品直接對比。英偉達方面,其即將推出的新品線將整合其以200億美元收購Groq所獲得的技術,專門針對超低延遲推理場景。
英偉達首席執行官黃仁勳此前表示,超過20%的AI工作負載可能最適合由此類芯片處理。Groq由一批前谷歌工程師於2016年創立。
為進一步擴大TPU的可及性,谷歌還在測試將TPU部署至客戶自有數據中心的方案,並推進與第三方軟件工具的兼容性。不過,芯片供應瓶頸以及AI模型快速迭代與多年期芯片開發周期之間的錯位,仍是谷歌擴大規模過程中需要應對的主要不確定因素。