金吾財訊 | 第一上海發研報指,近期,阿里巴巴(09988)正式發佈新一代Qwen-3系列大模型,在性能和推理效率上均進行了優化,滿足從邊緣端到服務器端不同場景下的推理需求。DeepSeek發佈DeepSeek-Prover-V2-671B模型,專注於形式化數學推理應用。小米開源其首個為推理而生的大模型Xiaomi MiMo,在數學推理和代碼競賽上取得優秀表現。此外,業界預期DeepSeek R2有望在5月亮相,預計仍將採用MoE模式,但是訓練參數量將達到1.2萬億,相比R1有接近翻倍的提升。據傳該大模型將由全國產算力訓練完成,不依賴英偉達芯片。該行認為,在年初DeepSeek掀起推理應用浪潮下,國產大模型在應用端的能力持續提升,AI應用有望廣泛落地,推理算力需求持續強化。同時,在美國限制H20出口的情況下,國產算力成為進口替代的不二之選。該行繼續看好國產算力的替代機會。建議關注後續互聯網大廠,以及金融、電信等行業的招標情況。