投資人Gavin Baker指出,谷歌TPU目前在AI訓練成本上領先英偉達"四代"Hopper芯片,使其能以負30%利潤率運營壓制競爭對手。但2026年初Blackwell芯片集羣投入使用後將逆轉局面。而谷歌在TPU開發上的保守設計和供應鏈策略,可能限制其長期競爭力。一旦失去成本優勢,谷歌維持虧損運營將變得不可持續,AI產業競爭格局將重塑。
英偉達新一代Blackwell芯片及其後續產品將在明年重塑AI訓練的成本結構,有望終結谷歌TPU在成本上的優勢。
12月9日,科技投資大佬Gavin Baker接受播客採訪時表示,谷歌憑藉TPU芯片在AI訓練領域佔據了低成本優勢。
Baker指出,在半導體時代,谷歌TPU芯片相當於擁有"四代噴氣式戰鬥機",而英偉達的Hopper芯片還停留在"二戰時代的P-51野馬"水平。這種成本優勢使谷歌能夠以負30%的利潤率運營AI業務,有效"抽乾AI生態系統的經濟氧氣"。
但Baker強調隨着英偉達Blackwell芯片集羣在2026年初開始投入訓練使用,以及更易部署的GB300芯片隨後上市,這一局面即將逆轉。一旦谷歌失去成本優勢,可能重塑AI產業的競爭格局和經濟模型。
Blackwell的複雜轉型造就谷歌窗口期
Blackwell的延遲部署為谷歌創造了意外的優勢窗口。
Baker認為,從Hopper到Blackwell的過渡是科技史上最複雜的產品轉型之一:數據中心機架重量從約1000磅增至3000磅,功耗從30千瓦躍升至130千瓦,冷卻方式從風冷轉為液冷。Baker形象地比喻:
這就像要使用新iPhone,你必須將家中所有插座改為220伏,安裝特斯拉電池牆、備用發電機、太陽能板和全屋加溼系統,還要加固地板。
正因為這些技術挑戰,Blackwell芯片直到最近三四個月纔開始大規模部署。
而如果不是推理技術的突破,AI進展本會在2024年中期至Gemini 3發佈期間完全停滯。推理技術有效"拯救了AI",在新一代芯片到來前填補了約18個月的空白期。
Baker預計,基於Blackwell訓練的首批模型將在2026年初問世,預計將由xAI率先推出。
Baker強調xAI為英偉達扮演了關鍵角色。他們快速的部署速度使得英偉達能夠在一個數據中心中,儘可能多部署GPU來形成連貫集羣,從而為所有客戶排除故障。這種"coherent"(連貫)意味着每個GPU都知道其他GPU的狀態,通過scale-up網絡和scale-out連接共享內存。
更關鍵的是,英偉達即將推出的GB 300芯片將具有"即插即用"的兼容性,能夠直接替換現有GB 200機架,無需額外的基礎設施改造,垂直整合的公司將成為新的低成本生產者。
TPU架構決策限制未來競爭力
谷歌在TPU開發上的保守設計選擇和供應鏈策略,可能限制其長期競爭力。
Gavin Baker指出,谷歌將TPU的前端設計留給自己,但將後端設計外包給博通,後者從中收取50-55%的毛利率。
以2027年TPU業務規模約300億美元估算,谷歌每年要向博通支付約150億美元。Baker指出,考慮到博通半導體部門的運營成本僅約50億美元,從經濟角度看,谷歌完全有理由將整個半導體項目收歸內部。
Baker表示蘋果正是採取這種模式,不依賴ASIC合作伙伴,自己完成前端後端設計,從而避免支付50%的利潤。
Baker認為谷歌已經開始採取行動,引入聯發科就是作為對博通的「警告」。這家中國臺灣ASIC公司的毛利率遠低於博通。
但這種供應商的分化也導致谷歌在設計上更加保守,使TPU的發展速度難以跟上英偉達GPU的年度迭代節奏。
相比之下,英偉達和AMD的策略是"每年推出一款GPU,讓競爭對手無法跟上"。而谷歌通過引入聯發科作為第二供應商,實際上是向博通發出警告信號,但這種分散供應可能進一步拖慢TPU進化速度。
戰略計算將發生根本轉變
一旦谷歌失去最低成本生產商地位,其戰略計算將發生根本性改變。
作為低成本生產商,以負利潤率運營AI業務以壓制競爭對手在經濟上完全合理——這可以削弱需要外部孖展的競爭對手,最終獲得主導市場份額。
但當Blackwell集羣轉向推理應用,成本動態改變後,繼續維持負30%利潤率對谷歌來說將變得"非常痛苦",甚至可能影響其股價表現。這將對整個AI產業的經濟格局產生深遠影響。
Baker強調,Ruben下一代芯片推出後,英偉達GPU與TPU及其他ASIC之間的差距將進一步擴大。