在谷歌與英偉達的側翼,中國玩家正用「光速」鋪設一條算力快車道

智東西
03/16

行業巨頭重金押注,數據中心網絡「以光換電」已成必答題。

作者 |  陳駿達

編輯 |  漠影

在上周舉辦的中國家電及消費電子博覽會(AWE)上,一項以OCS(光路交換)重塑智算網絡架構的最新成果,宣告落地。

上海儀電聯合曦智科技、壁仞科技中興通訊發布了「光躍超節點128卡商用版」,實現長期穩定訓練狀態,帶動模型訓練性能顯著提升,傳輸延遲相較傳統電交換降低90%以上。

該超節點以曦智科技全球首創的硅光OCS光交換芯為核心,最初在去年7月的WAIC大會上發布,僅用半年多時間,便實現從概念驗證到實際商用的跨越。這也是國內首個端到端OCS批量部署方案。

此外,這一方案成功了適配階躍星辰、DeepSeek等多個國產大模型,驗證了其成為高性價比、高能效國產算力解決方案的潛力。

面對大模型訓練中傳統電交換網絡日益嚴峻的功耗和延遲困境,擁有低功耗、低延遲和調度靈活性的OCS技術,正成為突破算力效能天花板的關鍵抓手。

01.

傳統電路交換網絡功耗問題難解

OCS如何成為AI時代的「破壁者」

首先要承認一個事實,當前在數據中心中,傳統的電分組交換(Packet Switch)仍然是主流。這主要是因為其技術成熟、生態完善。

從原理上來看,在交換數據時,電分組交換機首先將來自光纖鏈路的光信號通過光模塊轉換為電信號,然後在交換芯片中對數據包進行解析與轉發,最後再通過光模塊將電信號重新轉換為光信號併發送。

整個過程依賴「光-電-光」(O-E-O)的轉換與電子交換芯片完成數據處理,光模塊把光信號轉換為電信號,由交換芯片完成讀取、緩存與路由,再通過光模塊重新轉回光信號繼續發送。

可以把它理解為一個繁忙的鐵路貨運站。當滿載數據的列車到達時,必須進站停車,將貨物卸下、分揀、重新編組到另一列車上,再發車出站。列車在站內的每一次停頓、裝卸設備的持續運轉,都帶來更高的延遲與能耗。

以此類網絡中常見的400G光模塊(光電轉換器件)為例,其功耗大約為10W左右,傳輸1比特(bit)數據所消耗的能量大約為25皮焦耳(pJ)。再加上交換機內部負責處理信號的SerDes芯片本身的功耗,總能耗可輕鬆超過30 pJ/bit。更先進的800G模塊雖然在能效上有所提升,但單位能耗仍維持在15–20 pJ/bit的量級。

在超大規模數據中心中,這種能耗將迅速累積,不僅顯著增加運營成本,也給散熱和系統設計帶來巨大壓力。

這正是OCS(Optical Circuit Switch)能發揮價值的場景。

OCS可以在物理層直接改變光信號的傳播路徑。當數據流到達交換節點時,無需像電交換那樣經歷複雜切換過程,只需要調整方向,就能把光信號直接引導到目標鏈路上,從而建立一條端到端的光通路

它更像是在鐵路網絡中部署了一套智能道岔系統。光列車無需進站停車,直接切換軌道方向,保持高速直通狀態。雖然維持這個「道岔」系統的運行仍需要能量,但與O-E-O轉換相比,其能耗降低了幾個數量級,理論上能做到fj/bit(1000fj=1pj)量級。

除了能耗與延遲之外,OCS還在帶寬、可靠性、兼容性方面具有優勢。它不受電子交換芯片端口速率和SerDes速率的限制,可更輕鬆地支持高帶寬的數據傳輸;也不依賴於特定的數據傳輸協議,可無縫兼容不同廠商使用的互連協議,消除生態鎖閉風險。

同時,OCS可以在物理層快速重新建立光路。當某條鏈路或設備出現故障時,網絡能夠在幾秒內通過重新配置光通路繞過故障路徑,從而提高網絡的整體穩定性和容錯能力

02.

OCS技術路線分立

中國玩家探索現實可行方案

OCS的優勢明顯,但其技術門檻高、涉及多學科交叉。不同廠商和研究機構正基於各自的技術積累與產業生態進行探索:有的延續傳統光通信中的MEMS光開關路徑,有的嘗試基於硅光波導實現高度集成化的光交換,還有一些方案則採用液晶、壓電陶瓷等光學調控技術。

在這些技術路徑中,MEMS(微機電系統)OCS是目前相對成熟的一類方案。該方案通過微型可動反射鏡陣列改變光束傳播方向,實現端口之間的光路重構。

谷歌是全球範圍內唯一完成OCS大規模量產部署的公司,已有10年左右的研發經驗,其方案基於MEMS。結合谷歌開發的全棧軟件,這一方案極大提高了TPU訓練集羣的數據交換效率。

▲谷歌的MEMS光交換方案

MEMS方案的優勢在於端口規模大、光學性能穩定;但其也存在一定侷限,例如機械結構帶來的切換速度限制(目前為毫秒級)、器件體積較大以及系統封裝複雜度較高、價格昂貴等。

另一條備受關注的路線是硅光(Silicon Photonics)OCS。該方案利用硅基波導等器件在芯片上實現光信號的路由與切換。相比MEMS依賴微機械結構的方式,硅光方案沒有機械運動,切換速度可達微秒甚至納秒級。

一些初創公司正在推動硅光OCS的發展,例如國內的曦智科技等企業。曦智打造了全球首創的基於硅光子技術的OCS光交換芯片,相關研究論文被國際通信網絡領域頂級會議SIGCOMM 2025接收。

硅光OCS還能夠依託成熟的CMOS製造工藝實現規模化生產,並具備更好的集成度和潛在的成本優勢。但在光損耗控制以及熱串擾問題等方面,還有優化空間。

除了MEMS和硅光之外,OCS領域還存在一些其他技術路線,例如基於液晶材料調控光路的方案,以及利用壓電陶瓷驅動光學結構改變傳播路徑的方案等。這些技術各有特點,在切換速度、穩定性或成本方面提供了不同的工程權衡。

總體而言,OCS領域正處於「多路線並行探索」的階段,各種技術在端口規模、切換速度、能效與可製造性之間不斷尋找平衡,尚未出現絕對主導路線,未來很可能會在不同應用場景中形成多種技術並存的格局。

而結合國內當前的發展階段與技術環境,依託成熟半導體制造體系的硅光路線,在產業鏈協同和規模化製造方面具備一定現實優勢,也因此成為曦智等國內企業重點探索的方向之一。

03.

硬件落地先行、軟件生態跟進

OCS不再是「選答題」

在智東西與曦智科技CEO沈亦晨的溝通中,我們了解到,過去半年,曦智科技從軟件和硬件兩個方面雙管齊下,推動光互連光交換超節點的商用落地。

研發過程中,團隊面臨了巨大的工程挑戰。比如,在初期他們遇到了光信號連接不穩定、傳輸切換不如理論預期順暢等問題。為了解決這些問題,曦智科技聯合GPU廠商和服務器廠商,組建了龐大的技術團隊,通過大量的調優,最終實現了穩定部署的質變。

此外,曦智開發了光交換相關的配套軟件,並與GPU和服務器廠商等生態夥伴一道完善配套軟件生態。

對於「銅退光進」的演進,業界已經形成了基本共識。2025年底,市場調研公司Cignal AI發布了最新的OCS市場報告,這份報告的核心是:隨着超大規模數據中心和AI算力中心部署,OCS的角色從驗證逐漸過渡到大規模試點與商用,其部署範圍擴展至谷歌以外的更多廠商、更多應用場景,OCS的總市場規模到2029年將至少達到25億美元

英偉達這樣的頭部玩家正在用行動投票。本月,英偉達分別向Lumentum(MEMS路徑)和Coherent(液晶路徑)這兩家專注於OCS技術的企業投資了20億美元,並簽署了多年數十億美元的採購承諾和未來產能優先獲取權,體現出其對OCS的長期看好。

我們也與沈亦晨聊到了英偉達在OCS賽道的這一大動作。沈亦晨稱:「2-3年前,曦智便做出判斷,未來數據中心30%的芯片都會是光芯片,英偉達也一定會全面擁抱光芯片。」這次英偉達的押注,其實是因為光芯片即將在其產品中「快速起量」,因此需對供應鏈進行提前佈局。

至於不同技術路徑的選擇,沈亦晨保持了開放的態度。在他看來,不同OCS技術路徑雖有具體指標的差異,但核心功能共性高達80%-90%現階段的首要任務是將光交換集羣從概念變為現實,落地部署大規模光互連光交換集羣。

此外,硬件落地是軟件優化的前提。只有先擁有一套實體的光交換集羣,軟件和系統才能針對其特性進行優化。從「電交換」改為「光交換」是軟件層面最重要的變革環節在光交換體系內部,後續對軟件層面的優化屬於「邊際收益(marginal gain)」

沈亦晨類比道:「與其現在糾結於用哪一種技術路線的電機,不如先讓一輛電動車上路。車能上路,配套設施自然就會建起來。」

04.

結語:數據中心網絡「以光換電」

中國方案搶佔技術高地

OCS技術正以前所未有的方式重塑AI算力基礎設施。它不僅在能耗、延遲和帶寬上帶來質的飛躍,也為下一代超大規模大模型的訓練、推理和廣泛落地,提供了堅實支撐。

而在OCS加速落地的進程中,以曦智科技為代表的中國企業,正憑藉硅光OCS芯片、光躍超節點等創新實踐,探索一條自主可控、兼具高性能與高能效的國產算力路線。

沈亦晨透露,未來,除了在訓練側支撐千卡、萬卡級別集羣之外,曦智也計劃擴展128卡商用版本超節點在推理側的應用。而在今年的WAIC大會上,曦智將會公開下一代光交換集羣的方案。

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10