小米「神祕模型」,為何被錯認為DeepSeek V4?

阿爾法工場研究院
昨天

導語:小米MiMo大模型的掌舵人羅福莉,本是DeepSeek老將。

上周,OpenRouter突然冒出兩個匿名模型——Hunter Alpha和Healer Alpha。

沒logo、沒團隊、沒官方宣稱,卻直接殺上API調用日榜第一,全球開發者集體沸騰。連OpenClaw創始人都在社交平台X上公開打聽「誰在背後」? 

所有的猜測都指向了同一個名字:DeepSeek V4。

然而今天凌晨,小米卻突然官宣認領:

這兩個匿名模型的真實身份,是小米 MiMo-V2系列的早期測試版。

全網瞬間集體打臉。

為什麼一個手機大廠的模型,會被全世界開發者集體誤認為是DeepSeek的下一代神作?

DeepSeek V4的「馬甲」

小米這次的模型,的確有股熟悉的DeepSeek範兒。

  • 參數規格幾乎一樣

小米匿名模型露出的參數規格:萬億級參數、百萬token上下文、Agent專精路線,和市面流傳的DeepSeek V4傳聞幾乎一模一樣。 

  • 能力風格太像

Hunter Alpha在代碼生成、超長上下文、多步Agent任務裏的表現,讓人瞬間聯想到DeepSeek從V2到V3的「效率至上」血統。

  • 核心人才加盟

小米MiMo大模型的掌舵人羅福莉,本身就是DeepSeek老將。

羅福莉是業內公認的「AI天才少女」,北大計算語言學碩士,曾在阿里達摩院主導多語言模型,後轉戰DeepSeek,成為DeepSeek-V2關鍵架構核心開發者。2025年底被雷軍以千萬年薪挖角,11月官宣加盟小米。

如今市場認識一家模型公司,不是看logo,而是看參數形態、能力風格、訓練路線、核心人才的流動軌跡。 

羅福莉的加入,使得DeepSeek的基因,被小米直接復刻;匿名測試的打法,也被小米學得爐火純青。

中國AI實驗室的技術路線,已經趨同到分不清你我。

小米瞄準Agent底座

小米官宣認領後,市場焦點迅速轉向了「模型到底用來幹什麼」。

答案很清楚:MiMo-V2系列不是通用聊天工具,而是專為Agent場景打造的底座。

丨MiMo-V2-Pro(對應Hunter Alpha)是旗艦基座。

總參數超1萬億,激活參數42B,支持100萬token上下文。優化重點是長程規劃與多步推理。在OpenClaw框架下,它能獨立完成複雜任務。

社區實測顯示,它在編程和工具調用上的表現,已接近Claude Opus 4.6水平。

丨MiMo-V2-Omni(對應Healer Alpha) 是全模態版本。

上下文262K,原生支持文本、圖像、語音、視頻輸入與輸出。它能看圖、聽錄音、理解視頻,然後直接執行操作。

例如:截圖一張商品圖片,它可打開電商平台完成比價、下單;輸入一段會議錄音加白板照片,它能自動生成結構化筆記並在文檔工具中填充表格。

丨MiMo-V2-TTS 是配套的語音合成模型。

基於超過1億小時數據訓練,支持多方言、多角色、多語氣切換。

三組模型結合,形成了從意圖理解到執行的完整鏈路。

MiMo-V2官宣後,雷軍迅速發文為其站台:

Mimo-V2-Pro在全球大模型綜合智能排行榜Artificial Analysis上,位列全球第八。按大模型品牌來排名,排在全球第五,超過了xAI Grok。

跑分還是實戰?

每當有大模型發布,業內都會習慣性地思考,這到底是靠刷榜拿分,還是真能在真實場景裏幹活?

目前,各大權威基準測試顯示,MiMo-V2系列在邏輯推理和代碼領域的成績,位居全球第一梯隊。

AIME 2025數學基準測試中,MiMo-V2 Flash得分94.1%表明,已具備了接近人類頂尖競賽選手的能力 。

SWE-Bench測試顯示,MiMo-V2-Pro在編程任務上不僅大幅領先於國內競品,且在多項指標上與全球頂級模型並駕齊驅。

但質疑在於,傳統的靜態基準測試已無法衡量真實的智能水平。那麼,MiMo-V2在真實的人類任務中表現如何?

在以實戰著稱的PinchBench和Claw-Eval排行榜上,小米這組模型展現出了強大的執行力。

PinchBench排行榜中,MiMo-V2-Pro的任務完結率高達85%,目前穩居全球前三,僅次於目前頂級陣營(Claude 4.6 系列、GPT-5.4)。

在Claw-Eval中,MiMo-V2的指令服從度達到了97%,表現了對複雜工具鏈的理解深度。

事實上,MiMo-V2也在被開發者們用腳投票,真實調用量驚人。

OpenRouter數據顯示,MiMo-V2-Pro(Hunter)上線後多日佔據日榜第一,大量來自開發者真實Agent工作流。

來源:OpenRouter LLM Leaderboard(2026.3.10-2026.3.16)

社區實測後也給出了積極反饋,很多人認為這套組合把可用性拉到了新高度。

但也有開發者質疑,MiMo-V2有「面向特定框架/特定評測目標強優化」的嫌疑。

小米官方與OpenClaw生態都反覆強調對OpenClaw工具調用與多步任務的優化,同時公開訓練細節(數據配方、算力、RL 過程)缺失,很難從第一性原理排除「對OpenClaw等少數Agent基準過擬合」的可能性。

此外,也有開發者測試後表示,在安全對齊上,MiMo-V2-Pro與MiMo-V2-Omni差異明顯,前者強審查,後者更開放。這對企業合規、跨境產品一致性、安全體驗提出了挑戰。

小米的AI野心

無論外界對這組模型的表現是否有爭議,小米的這次出手,已經足夠讓整個大模型圈重新評價它。

2026年,中國大模型市場已經進入落地決戰階段,真正比拼的是誰能把模型真正嵌入用戶日常場景。

就在這個節點,小米把MiMo-V2系列直接推上前台。

過去三年,小米AI給外界的印象始終停留在應用層:超級小愛語音助手、澎湃OS的智能插件、手機端側的局部優化。它更像是一個終端廠商的輔助功能,而非獨立的基礎模型玩家。

然而,隨着MiMo-V2-Flash開源衝到全球Agent榜第二,再到這次MiMo兩款模型的匿名測試,小米不再是追隨者,而是開始建立自己的技術譜系。

這也意味着,小米的目標不只是證明自己做得出大模型,而是要進一步證明,這套能力可以成為整個生態的新底座。

因此,小米真正的AI戰略,是要構建「人-車-家」生態裏的統一智能層。

通過把MiMo系列深度嵌入小米自有的垂直鏈路——芯片(澎湃芯片)、操作系統(澎湃OS)、大模型、終端設備(手機、汽車、智能家居),讓AI不再是App裏的對話框,而是系統級的原生能力。

例如,用戶在手機上說一句「幫我把今天會議紀要整理好」,MiMo-V2直接理解意圖,自動調用WPS生成文檔,同時把關鍵行動項推送到車機導航和家居日程。

汽車行駛中檢測到用戶疲勞,MiMo-V2結合手機傳感器和車內攝像頭,直接調整空調、播放指定音樂,甚至提前通知智能家居煮咖啡。

這種閉環執行,依賴的是小米獨有的生態優勢:超過7億月活躍用戶、超過10億IoT設備,以及澎湃OS對硬件的完整權限控制。

其他純模型廠商只能停留在雲端API調用,但小米卻能把意圖直接轉化為物理世界的動作。

羅福莉曾在內部多次強調:小米不追求孤立的超級模型,而是要讓AI「走出對話框,接管真實生活」。

這正是小米與DeepSeek、智譜、月之暗面等純模型玩家的根本區別。前者靠生態落地,後者靠參數和API定價。

換句話說,小米正在完成一次根本轉型:從賣硬件的科技公司,變成用AI重新定義用戶生活方式的生態服務商。

MiMo-V2系列只是這個戰略的第一張牌。

競爭格局將如何重塑?

小米此番發力,直接把國產大模型的競爭推入新階段。

最先感受到衝擊的是價格體系。

MiMo-V2系列API定價僅為Claude Opus 4.6的五分之一:256K上下文以內,輸入1美元/百萬token,輸出3美元;即使擴展至1M上下文,費用也僅翻倍。

這一價格,直接把此前動輒數十美元的Agent調用門檻拉到極低。

有開發者反饋,不少團隊在測試MiMo Claw免費體驗後,已開始將部分生產任務遷移過來,「成本驟降」成為最常見的評價。

在國內市場,小米的突然入局也讓格局出現明顯裂變。

阿里通義、字節豆包等此前各自佔據參數或應用優勢的大模型,現在必須面對一個同時擁有頂級Agent能力和10億IoT設備生態的對手。

小米補齊了中國大模型最缺的落地閉環,把競爭焦點從「誰的參數更大」徹底轉向「誰能真正跑通真實場景」。

對DeepSeek而言,壓力也很直接:技術路線被繼承,Agent執行場景又被小米用硬件生態提前卡位。

全球視角下,小米正成為能與Apple Intelligence形成對標格局的硬件級AI生態。

蘋果目前仍以封閉端側小模型為主,強調隱私與本地計算;

小米則通過開放低價API+全鏈路權限,實現雲端意圖理解到物理設備執行的無縫銜接。7億月活用戶和澎湃OS的系統級控制權,可能會讓小米在AI普惠速度上領先一步。

匿名模型的發布,並不是一次簡單的測試,而是小米技術自信的一次集中亮相。

這意味着,小米已經不滿足於只做 AI 能力的承接者,而是在嘗試進入模型、系統與生態協同更深的一層。

這套體系最終能否成立,還需要時間驗證。

但可以確定的是,小米已經不再只是旁觀這場競賽,而是正式走進了牌桌中央。

#小米 #DeepSeek #大模型 #AI

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10