AI数据中心连接之战:铜退光进是真的吗? CPO时代供应链利润分配有什么变化?

华尔街见闻
May 11

铜与光在AI数据中心内的长期角力正迎来关键转折,但“铜退光进”的叙事远非真相全部。

Bernstein最新白皮书指出,随着AI集群规模迅速扩大,连接能力正成为影响系统性能与成本的核心瓶颈,也成为产业竞争的新焦点。未来多年,铜互联与光互联并非此消彼长的替代关系,而将在不同距离和应用场景中长期共存,并分别沿着“Scale-up”与“Scale-out”两条路径持续演进。

英伟达博通正推动CPO从概念走向商业化。英伟达明确表示,其CPO交换机将于2026年下半年小规模部署,CoreWeave与Lambda等AI云服务商为首批使用者。但因制造、封装与测试复杂度高,2026—2028年间,超大规模云服务商仍将以可插拔光模块为主流。同时,铜互联凭借成本、功耗与成熟度优势,在Scale-up场景中的主导地位至少延续三年。

CPO的真正意义在于重构产业链价值分配。Bernstein测算,CPO光引擎与激光器成本较1.6T可插拔模块均价高出约10%,但利润重心将从传统光模块厂商转向芯片制造与先进封装。

这一升级也将带动基础材料领域,如高阶PCB、ABF载板、T-glass玻纤等迎来结构性增长。但随着新产能集中释放,自2026年底起,价格竞争、折旧上升与供给扩张将逐步压缩盈利空间。投资者应聚焦在技术、制造与供应链控制上具备领先能力的企业。

铜与光各司其职,Scale-up与Scale-out路径分明

AI基础设施的扩张主要沿着两条路径展开:Scale-up与 Scale-out。

Scale-up 是在单一系统内部不断增加计算资源,例如在同一机柜或节点中部署更多AI加速器,以提升单个训练任务的计算效率;Scale-out 则通过连接更多机柜和服务器,将数据中心扩展为更大规模的计算集群,以提升整体容量和吞吐能力。

大型语言模型训练高度依赖张量并行(Tensor Parallelism)和专家并行(Expert Parallelism)等技术,需要在紧密耦合的 Scale-up Pod 内进行频繁的数据交换。这使得Scale-up场景对延迟和带宽的要求远高于Scale-out。目前,铜互联凭借成本低、功耗小和技术成熟等优势,仍是机柜内部连接的主流方案。在英伟达的GB300 NVL72 架构中,Superchip与交换芯片之间的高速通信依然主要依赖铜缆完成。

相比之下,光互联在长距离、高带宽传输方面优势更加明显。随着单通道速率提升至224Gbps及以上,光模块能够在10米甚至更远距离上实现低损耗传输,并支持太比特级扩展,因此已成为Scale-out架构中机柜间互联的核心技术。

LightCounting的数据显示,2025年全球光收发器及相关产品销售额已超过230亿美元,同比增长约50%;其中,以太网光收发器市场规模约170亿美元,同比增长60%。该机构预计,2024年至2026年,以太网光收发器市场将保持约59%的年复合增长率;到2026年至2030年,随着市场逐步成熟,增速将回落至15%左右。

这意味着,未来AI数据中心的连接架构并非“铜被光取代”,而是在不同层级形成清晰分工:铜互联继续主导短距离、高密度的Scale-up场景,光互联则支撑长距离、高带宽的Scale-out网络。两种技术将在未来多年内并行发展,共同构成AI基础设施扩张的核心底座。

CPO:从概念到落地的现实挑战

共封装光学(CPO,Co-Packaged Optics)通过将光引擎直接集成到XPU或交换芯片所在的基板上,省去传统光模块中的DSP,使数据能够通过更低功耗的SerDes直接传输。这种架构显著缩短了电信号路径,被视为下一代高速互联的重要方向。

英伟达表示,其CPO交换机相比传统可插拔光模块可实现约3.5倍的能效提升、63倍的信号完整性改善,以及10倍的网络韧性提升。博通则指出,采用CPO后,每比特的光学成本有望下降约40%。

不过,CPO距离全面普及仍面临诸多现实挑战。制造良率、测试复杂度、光纤耦合精度,以及云服务提供商对可维护性和供应商集中度的担忧,都是重要障碍。由于光器件被封装在交换机内部,一旦出现故障,通常需要更换整台交换机或返厂维修,停机时间明显长于传统方案。相比之下,可插拔光模块可以由数据中心运维人员现场快速更换,对业务影响极小。

基于这些限制,Bernstein预计,CPO在Scale-out网络中的小规模部署将于2026年下半年启动,主要目的是验证实际性能并测试供应链成熟度。率先采用的企业预计包括CoreWeave和Lambda等AI云服务商。

在更关键的Scale-up场景中,CPO进入时间可能进一步推迟至2028年下半年之后。原因在于,行业需要先在交换机侧充分验证其长期可靠性,才会将这一技术应用于价值更高、容错要求更严苛的XPU系统。

LightCounting预计,CPO真正的大规模出货将在2028年以后才会出现。在此之前,线性可插拔光学(LPO,Linear Pluggable Optics)可能成为更现实的过渡方案。LPO通过取消DSP,将信号处理交由线性组件完成,可将功耗较传统可插拔模块降低约三分之二,同时保留模块化设计带来的维护便利。

Bernstein认为,到2030年前,LPO的出货规模有望超过CPO。这意味着未来几年,数据中心光互联的主流方向并非一步迈向共封装,而是在可插拔、LPO和CPO三种架构之间逐步演进。

CPO改写价值分配:利润从模块厂商转向芯片与封装

英伟达Quantum-X800 CPO Switch 的成本结构拆解,清晰地指向一个结论:共封装光学技术正在深刻改写产业链的价值分配规则。

根据测算,该交换机配置4颗交换ASIC,每颗ASIC周围集成18个光引擎,整机共配备18个外置光源模块。每个光源模块包含8个连续波(CW)激光器,为所有光引擎提供稳定的激光输入。按此架构估算,单台Quantum-X800 CPO 交换机的总成本约为57万美元。

从定价结构看,CPO中的光引擎与激光器组合,其平均售价(ASP)至少比1.6T可插拔光模块高出10%。这一比较已考虑传统光模块厂商约40%的毛利率,以及CPO系统厂商约50%的毛利率。换句话说,CPO不仅没有降低整体价值量,反而通过更高集成度创造出更大的单机价值。

更重要的是,CPO改变了产业链中的利润归属。传统可插拔光模块的价值主要集中在模块厂商手中,其中DSP和其他电芯片构成了重要成本组成。而在CPO架构下,DSP被取消,光引擎直接与交换芯片共同封装,价值重心因此向芯片设计、先进封装和晶圆制造环节转移。

这意味着,英伟达、博通、台积电以及各类OSAT(外包半导体封装测试)厂商,将成为CPO时代的核心受益者。与此同时,上游关键零部件供应商也有望分享增长红利,包括Lumentum、Coherent等光器件企业,以及Chroma ATE等测试设备厂商。

相比之下,传统光模块厂商在CPO和未来NPO(Near-Packaged Optics)架构中的角色将被结构性削弱。随着封装和系统集成成为核心竞争力,行业利润将不再主要集中于收发器组装环节,而是向掌握芯片设计、先进制造和系统整合能力的企业集中。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10