DeepSeek之後首個!進擊的MiniMax

市場資訊
06-20

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

歷經兩年多的狂飆突進,國內大模型行業正在快速收攏。隨着DeepSeek的橫空出世,競爭格局也發生了改變,國產大模型六小虎中多家進行戰略調整、放棄模型預訓練,互聯網大廠也在發揮資源優勢進擊、轉向佈局自己更擅長的領域。

在這個過程中,是否要擁抱DeepSeek來增強自己的基模實力,是橫亙在所有模型廠商面前的一道選擇題。6月17日起,大模型六小虎之一Minimax開啓連續5天的新品發佈,首日就推出了用不同於字節、DeepSeek的強化學習方法訓練的全球首個開源混合架構推理模型MiniMax-M1。由此開始,Minimax也陸續交出了自己在DeepSeek大火這幾個月來籌備的新品,包括能生成AI視頻行業目前最高難度運動場景的新視頻生成模型Hailuo 02和MiniMax Agent、視頻Agent等產品。

DeepSeek向前走了一步,但前面還有很多步,MiniMax正在做出嘗試。

MiniMax開啓5天上新周

其中,文本新模型MiniMax-M1是世界上首個開源的大規模混合架構的推理模型。MiniMax方面表示,M1在面向生產力的複雜場景中是全球開源模型中的最好一檔,超過國內的閉源模型,接近海外的最領先模型的同時又有業內最高的性價比。目前,MiniMax以業內最低的價格在官網提供M1模型的API服務。

MiniMax在技術報告中提到,M1的一個顯著優勢是支持目前業內最高的“100萬”上下文的輸入,這個上下文輸入量等同於閉源模型裏Google Gemini 2.5 Pro的輸入量,也是DeepSeek R1的8倍之多。在推理輸出量上,M1目前也達到了業內最長的8萬Token。

根據公開資料整理

據悉,輸入長度的提升也主要得益於MiniMax獨創的以閃電注意力機制爲主的混合架構,從而在計算長的上下文輸入以及深度推理的時候顯著高效。例如,在用8萬Token深度推理的時候,只需要使用DeepSeek R1約30%的算力。這個特性使得在訓練和推理的時候都有很大的算力效率優勢。

MiniMax-M1發佈後引起了開發者的廣泛探討。其中,著名AI博主MinChoi評論稱,MiniMax-M1簡直可以說集Manus 、Deep Research、計算機技能和可愛於一體,隨即他還展出了自己用MiniMax-M1做的10個有趣案例。知名AI博主、佐治亞理工學院機器學習博士生Aran Komatsuzaki在M1發佈後表示,M1是目前開源模型中擁有460億活躍參數、接近最先進推理能力和代理能力的大語言模型,機器學習愛好者Vaibhav (VB) Srivastav也提到,在上下文長度上M1完全擊敗了DeepSeek R1和Qwen 235B。

MiniMax-M1發佈後引起海外科技圈熱議。

除了新模型MiniMax-M1以外,此次發佈周MiniMax拋出的另一張王牌是新視頻生成模型Hailuo 02。在視頻領域,MiniMax一直有着一定的統治力,早在2024年8月MiniMax就推出了海螺AI旗下的文本轉視頻模型Video-01,今年1月海螺AI推出最新自研S2V-01主體參考視頻模型,解決了AI視頻創作主體人物角色一致性的最大卡點。從2024年11月份到2025年3月,海螺視頻/Hailuo AI的月訪問量全球第一,力壓Sora、Runway等海外外AI視頻產品。

MiniMax稱,此次最新發布的Hailuo 02在複雜指令遵循和複雜物理表現方面特別出色,既可以完整響應一些相當複雜的指令,又可以讓仔細編寫的prompt得到更好的反饋。根據生成的demo可以看到,在AI視頻超難做好的如體操、雜技等考驗主體動作絲滑度、連貫度的場景中,Hailuo 02也能完整、連貫體現,甚至連光影變化都能處理。在價格上,目前Hailuo 02價格也低於Runway、Sora等視頻生成模型。

輸入“畫面中人物快速拋接球體,綵帶飄動落下,人物不停拋接球體”後生成的視頻。

DeepSeek之後基礎大模型仍有創新空間

歷經兩年多的狂飆突進,大模型行業正在快速收攏。在海外,大模型決賽圈被收攏至OpenAI、谷歌Meta、Anthropic和xAI五家公司,各家的發佈也呈現你追我趕的態勢。就在近期,谷歌剛帶着Gemini 2.5 Pro刷新在數學、編程、推理基準測試中的SOTA力壓OpenAI的o3、Claude 4等模型,一週後OpenAI快速推出o3-pro,並做到在智力水平上領先Gemini 2.5 pro。

在國內,隨着DeepSeek的橫空出世,競爭格局也發生了改變。其中,國產大模型六小虎中多家進行戰略調整、放棄模型預訓練,其中百川智能聚焦醫療、零一萬物擁抱DeepSeek提供部署的專門定製解決方案並押注行業落地。

同時,互聯網大廠也在發揮資源優勢繼續進擊。根據相關證券報告,2025年字節跳動資本開支有望達到1600億元,較去年的800億翻了整整一倍;而阿里巴巴集團CEO吳泳銘則在今年2月的2025財年第三季度財報分析師電話會上宣佈,未來三年,阿里將在AI基礎設施、基礎模型平臺及AI原生應用、現有業務的AI轉型等三方面加大投入,其中未來三年在雲和AI的基礎設施投入預計將超越過去十年的總和。

在國際和國內競爭加劇情況下MiniMax也成爲了爲數不多仍在堅持基礎模型研發的企業。

成立三年多來,MiniMax一直勇當“第一個喫螃蟹的人”。2023年下半年,當大部分國內大模型廠商還在繼續迭代稠密dense模型之際,MiniMax率先投入大量資源研究MoE架構,並於2024年1月上線國內首個MoE大模型abab6,MoE架構後續徹底取代稠密架構成了大模型領域技術迭代的行業共識,這也是今年年初爆火出圈的DeepSeek使用的主要架構。

這一次,Minimax也以創新的方式試圖改變DeepSeek-R1出現後形成的競爭格局。在此次發佈的MiniMax-M1模型中,MiniMax繼續創新地使用線性注意力Lightning Attention機制,同時也創造了一種名爲CISPO(Clipped IS-weight Policy Optimization)的全新強化學習方法,更好地保留了長推理鏈條中的關鍵轉折點,提高了學習效率與穩定性。技術報告顯示,CISPO算法比包括字節近期提出的DAPO等強化學習算法收斂性能快了一倍,並顯著的優於DeepSeek早期使用的GRPO。

知名數字經濟學者、工信部信息通信經濟專家委員會委員盤和林表示,在此次的新模型中,MiniMax的主要貢獻還是在閃電注意力這一大模型算法改進上,之前其他大模型採用PPO/GRPO採用的“裁剪”方式有一些缺陷,MiniMax則通過CISPO對這些缺陷進行了一些優化,其目的還是爲了降低訓練成本和推理成本,這是進步,但這個進步如何轉化爲商業價值還需要在應用層面的具體實踐。

盤和林還提到,現階段的基礎模型依然有很大的提升空間,這就是加碼大模型的創業公司的機會。“很多用戶並不喜歡用AI來幹活,大模型一定還是有優化空間的,誰找對了大模型算法優化的方向,誰就是下一個科技巨頭。deepseek向前走了一步,但還不夠。”

備戰下一個共識Agent時代

在產品發佈周“打頭陣”的MiniMax-M1技術報告中,MiniMax提到,“與最新的DeepSeek-R1-0528模型相比,MiniMax-M1在數學和編碼競賽中接近

DeepSeek R1-0528,而在更現實的工具使用和長上下文場景中實現了可比或更優的性能。值得注意的是,MiniMax-M1在代理工具使用基準TAU-Bench上優於Gemini 2.5 Pro,並在長上下文理解基準上超過了OpenAI o3和Claude 4 Opus。通過有效的測試時間擴展,我們認爲MiniMax-M1爲下一代語言模型Agent解決現實世界挑戰奠定了堅實的基礎。”

各家模型在“人工分析智能指數”上的表現,MiniMax-M1作爲開源模型表現優異。

看到這裏不難能意識到,MiniMax已經準備好參與大模型的下一個風口Agent。今年隨着Manus等智能體產品的爆火,Agent已經成爲科技圈繼大模型以後的第二個共識。更高效的推理和規劃能力、更長的推理時間和更便宜的價格,都是Agent能順利落地的重要因素。

除了準備好了一個更好的基底大模型來承接Agent爆發的需求,6月19日MiniMax也發佈了一個能完成長程(Long Horizon)複雜任務的通用智能體,該智能體能多步規劃出專家級解決方案、靈活拆解任務需求、執行多個子任務從而交付最終結果。據悉在MiniMax內部,該產品已經被使用了兩個月,逐漸成爲內部超過50%的同學日常使用的產品。

MiniMax Agent主打的點是“靠譜”,在研發過程中按照“靠譜的人”的標準來設計和要求Agent,比如在編程能力上包含複雜跳轉邏輯、能做全面測試從而不交付有bug的網頁;在多模態方面除了支持長文本文件也支持視頻、音頻、圖片等理解能力,也支持生成圖文音並茂的作品;同時支持MCP擴展、開放幷包。用戶可以用它來完成做動畫、廣告片、簡易ppt等任務。

今年4月底,MiniMax創始人、CEO閆俊傑在一次高層調研活動中彙報了MiniMax內部正在研發的智能體的技術創新點和應用場景,展示現場的白板上提到,未來智能體的模態內容從文本到多模態融合、智能體能執行任務的複雜度將從普通人半天工作量到專業人士一週工作量。

一個多月後,MiniMax Agent的正式發佈,正是對這份規劃的鄭重“交卷”。從“解放大腦”到“解放手腳”,從聰明的“聊天伴侶”到“靠譜的生產力工具”,MiniMax Agent的發佈,爲AI行業的發展注入了一劑強心針。

可以看到,MiniMax新模型M1選擇在進一步優化推理成本和Agent上發力,以創新方式調優結構、提高效率,疊加在視頻模型上的優勢,MiniMax再次攪動了大模型公司的格局。基礎模型、Agent和視頻模型也成爲了MiniMax未來能否拿到AI時代一張船票的關鍵所在。

文/林文琪

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10