金吾財訊 | 中信證券認為,底層基礎設施的通用性就是為了前瞻性地應對未來的模型發展。當前AI產業發展迅速,Scaling law在後訓練、在線推理等階段快速發展。訓練端,模型架構持續創新迭代,有望進一步強化訓練側scaling law的延續,如阿里巴巴Qwen團隊與浙江大學團隊提出的Parallel Scaling、騰訊混元團隊採用Transformer、Mamba混合架構訓練的TurboS都取得了優秀的性能表現。推理端,在MoE專家網絡架構成為主流後,如何通過硬件部署實現更高的吞吐量和更低的延時成為焦點。該機構認為,採用類似推理集群的形式未來有望成為主流,計算節點有望通過提升計算密度滿足推理需求。系統級算力料將成為下一代AI算力基礎設施。