導語:小米MiMo大模型的掌舵人羅福莉,本是DeepSeek老將。
上周,OpenRouter突然冒出兩個匿名模型——Hunter Alpha和Healer Alpha。
沒logo、沒團隊、沒官方宣稱,卻直接殺上API調用日榜第一,全球開發者集體沸騰。連OpenClaw創始人都在社交平台X上公開打聽「誰在背後」?
所有的猜測都指向了同一個名字:DeepSeek V4。
然而今天凌晨,小米卻突然官宣認領:
這兩個匿名模型的真實身份,是小米 MiMo-V2系列的早期測試版。
全網瞬間集體打臉。
為什麼一個手機大廠的模型,會被全世界開發者集體誤認為是DeepSeek的下一代神作?
DeepSeek V4的「馬甲」
小米這次的模型,的確有股熟悉的DeepSeek範兒。
參數規格幾乎一樣
小米匿名模型露出的參數規格:萬億級參數、百萬token上下文、Agent專精路線,和市面流傳的DeepSeek V4傳聞幾乎一模一樣。
能力風格太像
Hunter Alpha在代碼生成、超長上下文、多步Agent任務裏的表現,讓人瞬間聯想到DeepSeek從V2到V3的「效率至上」血統。
核心人才加盟
小米MiMo大模型的掌舵人羅福莉,本身就是DeepSeek老將。
羅福莉是業內公認的「AI天才少女」,北大計算語言學碩士,曾在阿里達摩院主導多語言模型,後轉戰DeepSeek,成為DeepSeek-V2關鍵架構核心開發者。2025年底被雷軍以千萬年薪挖角,11月官宣加盟小米。
如今市場認識一家模型公司,不是看logo,而是看參數形態、能力風格、訓練路線、核心人才的流動軌跡。
羅福莉的加入,使得DeepSeek的基因,被小米直接復刻;匿名測試的打法,也被小米學得爐火純青。
中國AI實驗室的技術路線,已經趨同到分不清你我。
小米瞄準Agent底座
小米官宣認領後,市場焦點迅速轉向了「模型到底用來幹什麼」。
答案很清楚:MiMo-V2系列不是通用聊天工具,而是專為Agent場景打造的底座。
丨MiMo-V2-Pro(對應Hunter Alpha)是旗艦基座。
總參數超1萬億,激活參數42B,支持100萬token上下文。優化重點是長程規劃與多步推理。在OpenClaw框架下,它能獨立完成複雜任務。
社區實測顯示,它在編程和工具調用上的表現,已接近Claude Opus 4.6水平。
丨MiMo-V2-Omni(對應Healer Alpha) 是全模態版本。
上下文262K,原生支持文本、圖像、語音、視頻輸入與輸出。它能看圖、聽錄音、理解視頻,然後直接執行操作。
例如:截圖一張商品圖片,它可打開電商平台完成比價、下單;輸入一段會議錄音加白板照片,它能自動生成結構化筆記並在文檔工具中填充表格。
丨MiMo-V2-TTS 是配套的語音合成模型。
基於超過1億小時數據訓練,支持多方言、多角色、多語氣切換。
三組模型結合,形成了從意圖理解到執行的完整鏈路。
MiMo-V2官宣後,雷軍迅速發文為其站台:
Mimo-V2-Pro在全球大模型綜合智能排行榜Artificial Analysis上,位列全球第八。按大模型品牌來排名,排在全球第五,超過了xAI Grok。
跑分還是實戰?
每當有大模型發布,業內都會習慣性地思考,這到底是靠刷榜拿分,還是真能在真實場景裏幹活?
目前,各大權威基準測試顯示,MiMo-V2系列在邏輯推理和代碼領域的成績,位居全球第一梯隊。
AIME 2025數學基準測試中,MiMo-V2 Flash得分94.1%表明,已具備了接近人類頂尖競賽選手的能力 。
SWE-Bench測試顯示,MiMo-V2-Pro在編程任務上不僅大幅領先於國內競品,且在多項指標上與全球頂級模型並駕齊驅。
但質疑在於,傳統的靜態基準測試已無法衡量真實的智能水平。那麼,MiMo-V2在真實的人類任務中表現如何?
在以實戰著稱的PinchBench和Claw-Eval排行榜上,小米這組模型展現出了強大的執行力。
PinchBench排行榜中,MiMo-V2-Pro的任務完結率高達85%,目前穩居全球前三,僅次於目前頂級陣營(Claude 4.6 系列、GPT-5.4)。
在Claw-Eval中,MiMo-V2的指令服從度達到了97%,表現了對複雜工具鏈的理解深度。
事實上,MiMo-V2也在被開發者們用腳投票,真實調用量驚人。
OpenRouter數據顯示,MiMo-V2-Pro(Hunter)上線後多日佔據日榜第一,大量來自開發者真實Agent工作流。
來源:OpenRouter LLM Leaderboard(2026.3.10-2026.3.16)
社區實測後也給出了積極反饋,很多人認為這套組合把可用性拉到了新高度。
但也有開發者質疑,MiMo-V2有「面向特定框架/特定評測目標強優化」的嫌疑。
小米官方與OpenClaw生態都反覆強調對OpenClaw工具調用與多步任務的優化,同時公開訓練細節(數據配方、算力、RL 過程)缺失,很難從第一性原理排除「對OpenClaw等少數Agent基準過擬合」的可能性。
此外,也有開發者測試後表示,在安全對齊上,MiMo-V2-Pro與MiMo-V2-Omni差異明顯,前者強審查,後者更開放。這對企業合規、跨境產品一致性、安全體驗提出了挑戰。
小米的AI野心
無論外界對這組模型的表現是否有爭議,小米的這次出手,已經足夠讓整個大模型圈重新評價它。
2026年,中國大模型市場已經進入落地決戰階段,真正比拼的是誰能把模型真正嵌入用戶日常場景。
就在這個節點,小米把MiMo-V2系列直接推上前台。
過去三年,小米AI給外界的印象始終停留在應用層:超級小愛語音助手、澎湃OS的智能插件、手機端側的局部優化。它更像是一個終端廠商的輔助功能,而非獨立的基礎模型玩家。
然而,隨着MiMo-V2-Flash開源衝到全球Agent榜第二,再到這次MiMo兩款模型的匿名測試,小米不再是追隨者,而是開始建立自己的技術譜系。
這也意味着,小米的目標不只是證明自己做得出大模型,而是要進一步證明,這套能力可以成為整個生態的新底座。
因此,小米真正的AI戰略,是要構建「人-車-家」生態裏的統一智能層。
通過把MiMo系列深度嵌入小米自有的垂直鏈路——芯片(澎湃芯片)、操作系統(澎湃OS)、大模型、終端設備(手機、汽車、智能家居),讓AI不再是App裏的對話框,而是系統級的原生能力。
例如,用戶在手機上說一句「幫我把今天會議紀要整理好」,MiMo-V2直接理解意圖,自動調用WPS生成文檔,同時把關鍵行動項推送到車機導航和家居日程。
汽車行駛中檢測到用戶疲勞,MiMo-V2結合手機傳感器和車內攝像頭,直接調整空調、播放指定音樂,甚至提前通知智能家居煮咖啡。
這種閉環執行,依賴的是小米獨有的生態優勢:超過7億月活躍用戶、超過10億IoT設備,以及澎湃OS對硬件的完整權限控制。
其他純模型廠商只能停留在雲端API調用,但小米卻能把意圖直接轉化為物理世界的動作。
羅福莉曾在內部多次強調:小米不追求孤立的超級模型,而是要讓AI「走出對話框,接管真實生活」。
這正是小米與DeepSeek、智譜、月之暗面等純模型玩家的根本區別。前者靠生態落地,後者靠參數和API定價。
換句話說,小米正在完成一次根本轉型:從賣硬件的科技公司,變成用AI重新定義用戶生活方式的生態服務商。
MiMo-V2系列只是這個戰略的第一張牌。
競爭格局將如何重塑?
小米此番發力,直接把國產大模型的競爭推入新階段。
最先感受到衝擊的是價格體系。
MiMo-V2系列API定價僅為Claude Opus 4.6的五分之一:256K上下文以內,輸入1美元/百萬token,輸出3美元;即使擴展至1M上下文,費用也僅翻倍。
這一價格,直接把此前動輒數十美元的Agent調用門檻拉到極低。
有開發者反饋,不少團隊在測試MiMo Claw免費體驗後,已開始將部分生產任務遷移過來,「成本驟降」成為最常見的評價。
在國內市場,小米的突然入局也讓格局出現明顯裂變。
阿里通義、字節豆包等此前各自佔據參數或應用優勢的大模型,現在必須面對一個同時擁有頂級Agent能力和10億IoT設備生態的對手。
小米補齊了中國大模型最缺的落地閉環,把競爭焦點從「誰的參數更大」徹底轉向「誰能真正跑通真實場景」。
對DeepSeek而言,壓力也很直接:技術路線被繼承,Agent執行場景又被小米用硬件生態提前卡位。
全球視角下,小米正成為能與Apple Intelligence形成對標格局的硬件級AI生態。
蘋果目前仍以封閉端側小模型為主,強調隱私與本地計算;
小米則通過開放低價API+全鏈路權限,實現雲端意圖理解到物理設備執行的無縫銜接。7億月活用戶和澎湃OS的系統級控制權,可能會讓小米在AI普惠速度上領先一步。
匿名模型的發布,並不是一次簡單的測試,而是小米技術自信的一次集中亮相。
這意味着,小米已經不滿足於只做 AI 能力的承接者,而是在嘗試進入模型、系統與生態協同更深的一層。
這套體系最終能否成立,還需要時間驗證。
但可以確定的是,小米已經不再只是旁觀這場競賽,而是正式走進了牌桌中央。
#小米 #DeepSeek #大模型 #AI