台積電:「一定要記住COUPE」

藍鯨財經
06/04

文|半導體產業縱橫

2021年,台積電在Hot Chips上發布了最新的3D封裝技術路線圖,裏面涉及了一個硅光封裝COUPE。

這一年行業最熱的話題是3nm、2nm,硅光封裝只是小小一點。但台積電看到的是另一個問題:當AI訓練集群的GPU從幾十塊跳到萬卡級別,數據在芯片之間跑來跑去的代價,開始變得讓人難以忽視。

五年後,故事翻轉了。台積電宣佈硅光整合平台COUPE於2026年進入量產。英偉達博通的訂單已經砸下去了,三星在追趕。今年,台積電副共同營運長張曉強在技術論壇上說了句話:一定要記住COUPE。

01一個被忽視的瓶頸

過去幾十年,數據中心內部GPU和交換機的通信靠的是可插拔光模塊,可以理解為一個可以拔插的盒子,把電信號變成光信號發出去,對方再把光信號變回電信號。這套架構的好處是:簡單、好用、出問題換掉就好。

但是AI的瘋狂,再次刷新了需求。當單次訓練任務的GPU數量從幾十跳到數萬,當傳輸速率從400G漲到800G、1.6T,信號在電→光→電之間來回折騰的代價開始失控。傳統DSP可插拔方案處理1.6T信號,功耗在30瓦量級。在先進製程競賽中,這個功耗數字聽起來不算什麼,但放在數萬GPU同時跑的大模型訓練裏,光是光模塊的能耗就能喫掉的整台服務器的電力配額。更關鍵的是,FEC糾錯需要額外的處理時間,在大模型分佈式訓練的場景下,這些零碎加起來,足以讓相當一部分GPU在等數據。

銅能救場嗎?短距離可以,但是一旦跨機架、跨節點,信號衰減和延遲就扛不住了。業界需要新的方案。

可插拔光學器件、OBO、NPO 和 CPO

可插拔和CPO 的功耗

業內選擇了光互連,用光代替電來傳數據,功耗更低、延遲更短、帶寬密度更高。但問題在於,怎麼把光學器件和電學芯片高效地集成在一起?傳統做法是分立設計、光模塊單獨封裝,但這種方式在AI場景下顯得太鬆散,信號路徑太長,損耗太大。

CPO,共封裝光學,就是來解決這個問題的:把光學引擎直接塞進芯片封裝裏,讓光信號在最靠近處理器的地方產生。

想法不復雜。實現起來,是另一回事。

02 COUPE是什麼?

硅光子不是什麼新鮮事。2000年代初就有人在研究了。優勢明確:跟CMOS工藝兼容,成本可控,可大規模集成。但難題同樣明確:光學器件和電學芯片怎麼高密度地捏在一起?光學耦合怎麼搞?封裝精度怎麼保證?測試怎麼搞?這些問題不解決,硅光子就無法大規模量產。

台積電給出的思路是:既然硅光子自己搞不定,那就讓它跟台積電最強的封裝能力綁在一起。CoWoS、SoIC,這兩把刀在AI圈已經是響噹噹的了。

2023年,台積電在IEEE ECTC上推出COUPE 2.0,核心升級是引入混合鍵合(Hybrid Bonding)技術。芯片之間不再靠微凸塊(bump)連接,而是在室溫下讓氧化物分子直接「吸」在一起,再升溫退火讓銅鍵合。這個工藝大幅縮短了電子芯片和光子芯片的間距,把信號傳輸的損耗壓到最低。

進入2024年,COUPE進入密集驗證階段。IEDM大會上,台積電公布了更多細節:單模硅波導損耗0.67dB/cm,氮化硅波導低至0.21dB/cm,Ge探測器響應率接近1A/W,200Gbps微環調製器的誤碼率不到一億分之一。也就是說,COUPE不但能幹活,而且乾的好。

不過,能把複雜的事情變得簡單,纔有資格收溢價。真正讓COUPE從技術變成生意的是台積電的改變。

這裏要插一段行業背景:在硅光子這件事上,GlobalFoundries其實是更早的玩家,2017年就開始給客戶代工硅光芯片,積累了大量經驗。按理說,它應該佔據先機。但GlobalFoundries的模式是典型的foundry思維:我只管造芯片,後面的封裝集成你自己搞定。這套邏輯對有完整光電設計能力的頭部客戶沒問題,但具備這種能力的公司,全球數不出十家。

台積電的打法不同,它不只造芯片,還包圓了整個封裝流程。從硅光子晶圓製造,到電子芯片和光子芯片的鍵合,再到光學封裝,全部在台積電的產線裏完成。客戶只需要把需求提了,剩下的一站式搞定。

這個差異最終決定了客戶的流向。2025年,英偉達和博通開始把部分產品從GlobalFoundries遷移到台積電COUPE平台。更關鍵的是,當英偉達決定用6nm先進邏輯節點做電子控制芯片時,只有台積電能同時搞定先進製程和混合鍵合封裝,其他家要麼工藝領先但封裝跟不上,要麼封裝可以但先進節點沒有。

繞了一圈,CoWoS成了入場券,而台積電獨發。

03 COUPE量產,產業鏈變局

COUPE量產的影響,遠不止台積電自己。目前,供應鏈價值正在從傳統光模塊廠商向半導體與先進封裝環節轉移。

激光器將從配套零件變成核心資產。傳統可插拔光模塊用的是EML激光器,調製器是集成在裏面的。但CPO需要外部連續波激光器,一個持續發光、功率高達數百毫瓦的激光光源,通過分束器同時給多個光子通道供光。技術門檻完全不在一個量級。同時,這類激光器的核心材料是磷化銦(InP),全球供應偏偏偏緊。需求在漲(光通信市場擴張、CPO新增需求、出口限制),產能卻跟不上。

結果是,激光器廠商從幕後走到了聚光燈下。Coherent認為,InP(磷化銦)的供需失衡至少將持續整個2026和2027年。Coherent正全力推進6英寸InP晶圓的量產爬坡。Lumentum預計到2026財年底,EML產能將較2025年增長超50%,因此公司已推進約40%的磷化銦(InP)擴產計劃。2026年3月,英偉達直接砸了40億美元(各20億)投資Lumentum和Coherent,鎖定多年採購承諾。

測試設備廠商也是贏家。CPO的製造複雜度遠超傳統光模塊。從光子晶圓測試、芯片鍵合、光引擎裝配到整機測試,每個環節都需要微米級精度的專用設備。聯訊儀器、Chroma、ficonTEC在CPO量產鏈路上不可或缺。Yole預測,CPO市場將從2024年的4600萬美元飆升至2030年的81億美元,這意味着,測試設備的訂單高峯還在後面。

FAU廠商也將受益。光纖陣列單元(FAU)是把芯片產生的光信號耦合進光纖的關鍵組件。在CPO架構下,FAU需要更高的耦合精度和更復雜的封裝集成。在CPO場景下,單個FAU的價值量將顯著提升。天孚通信等國內FAU廠商憑藉精密加工能力,正成為CPO產業鏈中不可或缺的一環。

傳統光模塊廠商會受到一定的衝擊。中際旭創新易盛是這場變局中最典型的案例。這兩家全球光模塊龍頭,2025年業績都在高速增長(中際旭創淨利潤按年增長109%,新易盛按年增長235%)。可插拔時代,光模塊廠商是方案的集成商,掌握着光電轉換的核心環節。但到了CPO時代,光引擎和XPU/交換機芯片被共封裝在一起,方案集成商的位置被半導體廠商(英偉達、博通)和OSAT接手,傳統光模塊廠商能做的只剩下光引擎製造和外部光源組件。

不過,中際旭創早已官宣光引擎實現自研自產,新易盛也在2026年3月表態手握光引擎技術。它們的策略是:既然你不需要「外掛」的模塊,那我就把核心的「光引擎」做好了賣給你。從「賣模塊」到「賣光引擎」,這是頭部廠商的主動轉型。

04 競賽纔剛起步

2026年,Scale-out CPO(機架間互聯)交換機開始量產出貨,這是當前的主戰場。但真正的挑戰是2027年-2028年時,Scale-up CPO(機架內GPU互聯)方案。Scale-up CPO意味着光互連要進到機架內部,直接和GPU封裝在一起。這個場景對技術的要求更高,對供應鏈的控制也更嚴。

台積電並非這一賽道的唯一玩家。

每當台積電宣佈什麼大動作時,另一位韓國友商也會迅速跟進。對,說的是三星。今年3月,三星電子正式宣佈進軍光通信市場。三星電子路線圖顯示,將於2027年實現基於TC(熱壓)鍵合的光引擎,2028年實現混合鍵合過渡,2029年開始提供「交鑰匙」CPO服務,即一站式、全流程的CPO代工總包。

目前,Tower Semiconductor的硅光子收入還在持續增長。從2024年約1.06億美元增長到2025年約2.28億美元,並計劃將產能擴大5倍以上。今年已經與最大硅光子客戶簽署總額13億美元的2027年供貨合同,並已收到2.9億美元預付款用於產能預留。公司還披露,客戶已就2028年承諾更大規模的晶圓訂單,相關追加預付款將於2027年1月前到位。

同時業內也有很多後起之秀,Ayar Labs、Lightmatter、Celestial AI,這波企業走的更激進,直接把光子塞進XPU封裝裏,瞄準2028年以後的下一代市場。Marvell宣佈用32.5億美元收購Celestial AI,就是希望早早佔位。

05結語

台積電正在打造完整的「三層蛋糕」AI平台架構,包括SoIC、CoWoS與COUPE光互連技術。

台積電錶示,全球首款採用COUPE技術的200Gbps 微環調製器(Micro Ring Modulator)已於今年開始生產,並已實現低於一億分之一的比特誤碼率。

到2030年前,台積電將通過400Gbps光調製器、多波長與多光纖陣列技術,把帶寬密度提升8倍至4TBps。相較傳統銅線,COUPE可讓系統能效提升4 倍、延遲降低10倍;若進一步與封裝平台深度整合,能效甚至可提升至10倍,延遲降低20倍,成為未來AI數據中心的重要基礎技術。

COUPE的需求將越發旺盛。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10