在AI軍備競賽日益白熱化的背景下,谷歌正憑藉其從芯片到網絡的「全棧式」創新構築獨特的算力護城河。
在中泰證券看來,這一輪「谷歌鏈」爆發的關鍵技術變量在於OCS光交換技術的全面引入。通過深度整合自研TPU芯片與OCS(光電路交換機)技術,谷歌不僅突破了傳統數據中心的能效與擴展瓶頸,更為下一代智算網絡確立了新的架構標準。
TPU與OCS的深度耦合,不僅支撐了Gemini等大模型的高效迭代,也直接帶動了上游光模塊(特別是1.6T)、MEMS芯片、光器件等產業鏈環節的增量需求。AI數據中心正從靜態架構向動態光子互聯演進。
TPU v7「Ironwood」放量:ASIC市場的主導力量
中泰證券認為,谷歌AI已圍繞芯片(TPU)—網絡(OCS)—模型(Gemini)—應用(雲計算/搜索/廣告等)全棧優勢構築護城河。
從2011年穀歌成立谷歌大腦 (Google Brain)實驗室開始涉足AI開始,一系列具有影響力的AI研究相繼問世,包括2017年發布Transformer架構到2023年推出多模態大模型Gemini,目前已形成從芯片到集群架構到大模型再到應用端的佈局,谷歌將AI逐步整合到多元業務流程中,這些業務為谷歌獲取了海量數據,用於訓練完善AI。
分析師強調,谷歌自研芯片的跨越式發展是其算力戰略的核心。
即將全面上市的TPU v7(Ironwood)在性能上實現了質的飛躍,單芯片計算能力較上一代TPU v5p提升超過十倍,峯值帶寬達7.4 TB/s。
在集群架構上,Ironwood繼續沿用且優化了3D Torus(三維環面)拓撲結構。該架構允許將多個「4×4×4」的立方體構建塊動態組合,單集群規模可擴展至9216顆芯片。為了匹配這一極高的算力密度,TPU v7開始配置1.6T光模塊,這也帶動了市場對高速光模塊需求的預期上修。
供應鏈調研指出,2026年穀歌TPU將成為全球自研ASIC市場的主力,預計出貨量遠高於AWS Trainium或Microsoft Maia等競品。隨着英偉達GB200與谷歌TPU v7的雙重拉動,2026年行業1.6T光模塊需求有望上修至2000萬隻以上。
OCS:打破傳統電交換瓶頸的關鍵技術
中泰證券表示,谷歌在AI數據中心大規模引入OCS(光電路交換機)的核心邏輯在於解決大規模擴展(Scale-Out)帶來的功耗與效率難題。
傳統數據中心架構正在失效。在傳統Clos架構中,隨着算力集群規模指數級擴張,基於電信號的分組交換機(EPS)面臨着嚴重的功耗散熱問題和昂貴的佈線成本。據Cisco測算,數據中心交換系統的總功耗在過去十餘年間提升了22倍。
谷歌引入OCS,本質上是用物理光路直接傳輸數據,徹底拋棄了「光—電—光」的信號轉換過程。
這其中,OCS是實現服務器解耦(Server Disaggregation)的關鍵,它允許計算資源跨機架動態編排,像搭積木一樣組合算力,從而突破了靜態機架的資源浪費瓶頸。在Ironwood集群中,48台OCS交換機連接了9216個TPU芯片,構建了一個低延遲、高帶寬的動態光子網絡。
數據證明了這一技術路線的優越性:引入OCS定製化網絡後,谷歌網絡的吞吐量提升了30%,功耗降低了40%,網絡宕機時間減少了50倍,最關鍵的是,它讓資本開支減少了30%。
解構谷歌OCS:獨特的MEMS技術與定製光器件價值
中泰證券表示,理解「谷歌鏈」的投資價值,必須理解OCS的物理構成。
目前谷歌主流的Palomar OCS基於MEMS(微機電系統)方案,擁有136個光路通道(實際使用128路)。其核心工作原理是通過2D MEMS微鏡陣列反射光信號,實現毫秒級的光路切換,無需光收發器進行電信號轉換。
這套系統帶來了一系列獨特的硬件需求。
首先是定製光模塊,谷歌在光模塊中內置了環形器(Circulator),實現了單根光纖的雙向傳輸,這使得所需的端口和光纜數量不僅比傳統胖樹架構減少了40%,還創造了環形器這一增量市場。
其次是核心光學元件,包括MEMS陣列、準直器、2D透鏡陣列等,這些精密光學元器件的單機價值量極高。此外,雖然谷歌目前主推MEMS方案,但也正在探索液晶、壓電陶瓷和硅光波導等新技術路徑,為供應鏈上的技術創新者提供了潛在的入局機會。
OCS技術的崛起為光通信產業鏈帶來了全新的增量環節。隨着微軟、Meta等其他雲服務商也開始探索OCS應用,Lightcounting預測2024-2029年OCS市場將以28%的複合增速增長,行業正迎來技術與需求的雙重爆發期。