全球首款 3.2T NPO 模塊,阿里雲成功點亮

半導體行業觀察
03/01

Scale-up 互連從銅到光的必然演進

隨着大模型架構從 Dense 向 MoE 演進,並融合訓練與推理一體化範式,系統對互連網絡在節點規模、帶寬密度、通信時延和運行穩定性等方面提出更高要求。高性能互連已成為制約超大規模 AI 集羣效率與擴展能力的關鍵基礎設施。

當前主流 Scale-up 方案依賴機櫃內銅纜互連。儘管銅互連在成本與時延上具備優勢,但其傳輸距離受限,迫使系統採用極致高密度、強耦合的「AI Rack」架構,導致製造、佈線、供電、散熱與運維複雜度隨規模急劇上升。當集羣擴展至百卡乃至千卡級別時,銅互連的物理覆蓋能力已接近極限。因此,從銅到光的演進,成為 Scale-up 邁向更大規模、更高可運維性的必然路徑。

阿里雲全光 Scale-up 網絡架構-UPN512

阿里雲於 2025 年 10 月正式發布 UPN512(Ultra-Performance Network for 512 xPU)全光 Scale-up 架構白皮書,提出基於單層以太網光互連的全新設計,旨在構建「大規模、高性能、高可靠、低成本、易擴展」的 xPU 互聯繫統。

UPN512 通過光互連直接連接 xPU 與交換機,採用單層 CLOS 拓撲實現 512 顆 xPU 的全互聯,並為未來擴展至 1K+ 節點預留架構空間。該方案徹底消除機櫃內高速銅纜,顯著降低佈線複雜度、散熱負擔、供電需求及運維成本。

UPN 512 關鍵技術-NPO(Near-Packaged Optics)

NPO(Near-Packaged Optics,近封裝光學)是 UPN512 架構的核心使能技術。它將光電引擎部署在靠近主芯片的位置,採用線性直驅(Linear Direct Drive)技術,省去傳統依賴先進製程的 DSP 芯片,從而實現:

功耗降低 50%以上

成本下降 30%

端到端時延與銅互連相當

供應鏈更安全可控

相比 LPO(Linear-drive Pluggable Optics),NPO 提供更高的帶寬密度,並降低對主芯片 SerDes 性能的要求,更利於生態發展;相比 CPO(Co-Packaged Optics),NPO 採用標準 LGA 連接器,保持光模塊的開放解耦特性,避免主芯片與光引擎綁定,更易被終端用戶採納。

基於NPO光互聯繫統示意圖

阿里雲選擇從 3.2T NPO 切入研發,基於 OIF 標準封裝,在僅 22.5mm × 35.1mm 的尺寸內實現 3.2Tb/s 傳輸帶寬。通過標準 LGA 連接器,光引擎與主芯片實現物理與電氣解耦,延續了開放、繁榮的光模塊生態。該模塊同時支持硅光(SiPh)與 VCSEL 兩種技術路線,可靈活適配不同距離與應用場景。

阿里雲3.2T NPO模塊形態圖

基於硅光方案的3.2T NPO內部結構

全球首款 3.2T NPO 模塊成功點亮

近日,阿里雲宣佈全球首款基於 OIF 標準封裝的 3.2T NPO 模塊成功點亮,標誌着全光 Scale-up 邁入工程落地新階段。

該模塊基於兩顆 16 通道收發一體硅光芯片,搭配線性直驅 Driver/TIA 芯片,採用成熟的 2D 封裝工藝,將光子集成電路(PIC)與電子集成電路(EIC)倒裝集成於 mSAP 基板上,具備快速量產潛力。

3.2T NPO全功能模塊(內部芯片佈局圖)

關鍵性能指標如下:

發送端:光眼圖性能優異,典型 TDECQ 僅為 1.9dB,全面符合 IEEE 802.3bs DR4 標準,可與傳統帶 DSP的 DR4 光模塊無縫互通,支持新舊架構混合部署;

接收端:在 1E-6 誤碼率下,所有通道靈敏度優於 -5dBm,確保充足鏈路預算;

功耗:典型功耗約 20W,顯著低於同帶寬 DSP 方案。

發送端光眼圖

接收端靈敏度

阿里雲首個 NPO 項目落地:國產四芯片交換機

阿里雲已將 3.2T NPO 技術率先應用於新一代國產四芯片交換機。該設備單機集成 4 顆 25.6T 國產交換芯片,總交換容量達 102.4T,並可通過升級至 4×102.4T 芯片平滑演進至 409.6T 平台。

創新之處在於:每顆芯片以細粒度端口模式(如256×100G)運行,系統內部將物理端口的多條 lane 拆分並連接到不同交換芯片,從而最大化單芯片 Radix 利用率,提升組網規模與靈活性。對外仍以 400G/800G 等主流端口形態交付,兼容現有 MPO 光纖佈線體系。

為實現高密度交叉互聯,該交換機採用基於 NPO 的系統級光互連設計:

NPO 模塊緊鄰交換芯片部署,在芯片側完成電-光轉換,大幅縮短電通道、減少信號損耗;

光信號經前部集成的 Shuffle 光交叉模組匯聚後輸出至面板;

交換模組與 Shuffle 模組間採用快插式光連接,支持模組級熱插拔與獨立更換,將故障影響範圍收斂至最小單元,顯著提升現場運維效率與系統可用性。

目前,該交換機已完成整機上電與核心功能驗證,NPO 端口實現穩定鏈路建立,項目正式進入長期可靠性測試階段。

基於NPO的國產四芯片交換機硬件架構圖

基於NPO的交換模組實物圖(包含散熱器)

基於NPO的交換模組實物圖(不含散熱器)

NPO 下一步規劃

阿里雲基礎設施事業部物理網絡研發團隊正聚焦 NPO 在長期運行下的穩定性與故障率驗證——這是決定全光 Scale-up 能否規模化落地的關鍵。同時,團隊正聯合多家頭部互聯網企業,在 ODCC(開放數據中心委員會) 推動 6.4T UPO(Ultra Performance Optics)標準立項,旨在構建下一代高性能、低功耗、開放解耦的光互連生態。相關技術規範預計將於 2026 年發布,敬請期待。

阿里雲將持續推動光互連技術創新,加速 AI 基礎設施普惠化。

(來源:阿里雲基礎設施)

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀讚好同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10