智通財經APP獲悉,國泰海通證券發布研報稱,近日,上海AI獨角獸MiniMax發布覆蓋文本、視頻、語音、音樂的全模態大模型"全家桶",M2在權威排行榜中登頂全球開源模型,標誌着中國AI企業在全模態技術領域實現全面突破,為商業化落地打開新局面。
國泰海通主要觀點如下:
投資建議:近日,上海AI獨角獸MiniMax發布全模態「全家桶」,成了覆蓋文本、視覺、語音、音樂的全模態技術體系。其文本大模型M2在全球權威測評中躋身第一梯隊,並以極致的成本效益突破「性能、速度、成本」的不可能三角,標誌着中國AI技術實現從跟跑到領跑的關鍵跨越。
近日,MiniMax發布全模態「全家桶」,其文本大模型M2登頂全球開源大模型。MiniMax密集發布了四款重磅模型:文本大模型M2、視頻生成模型Hailuo 2.3、語音模型Speech 2.6和音樂模型Music 2.0;其中,MiniMax-M2一款專為智能體與代碼優化而設計的開源文本模型,以10B激活參數(總參230B)的輕量級架構,在全球權威測評Artificial Analysis(AA)排行榜中斬獲全球前五、開源第一的成績,成為首個躋身該排行榜全球第一梯隊的中國開源大模型。
M2在模型效率與成本控制方面樹立了新標杆,發布後調用量激增。M2綜合推理成本低至0.53美元/百萬Token,僅為Claude 4.5 Sonnet的8%,同時推理速度接近後者的兩倍,在模型性能、推理速度與使用成本的"不可能三角"中實現了突破性平衡,為大規模商業化應用提供了堅實的技術基礎。MiniMax-M2憑藉0.53美元/百萬Token的極致性價比,在發布後5天內即在API平台OpenRouter的調用量躍居全球第四、國產第一,編程場景調用量更是位列全球第三。這一市場表現驗證了其在高性能與低成本之間的卓越平衡,為國產模型在全球範圍內的商業化推廣提供了成功範例。
全模態產品矩陣展現完整技術佈局,以確保生成質量與穩定性為核心目標。公司的「全家桶」模型裏,Hailuo 2.3視頻生成模型支持生成最長10秒的原生1080p高清視頻,採用噪聲感知計算重分配架構,訓練和推理效率相比前代提升約2.5倍;Speech 2.6專為語音智能體場景深度優化的語音模型,將首包響應時間壓減到250毫秒,達到語音賽道的絕對頭部水平;Music 2.0能夠生成結構完整、最長5分鐘歌曲的音樂模型。特別值得關注的是,在全行業普遍採用簡化注意力機制的背景下,MiniMax堅持投入更高成本的完整注意力機制,確保模型在長上下文、複雜邏輯推理等場景下的生成質量與穩定性,這一技術選擇體現了企業對基礎算法研究的長期投入與對技術品質的極致追求。
風險提示:大模型迭代速度不及預期,算力供給不足,數據隱私合規風險。