小米開源首個推理大模型Xiaomi MiMo

新浪科技
04-30

  新浪科技訊 4月30日上午消息,小米開源首個爲推理(Reasoning)而生的大模型‘Xiaomi MiMo’,聯動預訓練到後訓練,全面提升推理能力。

  據介紹,在數學推理(AIME 24-25)和 代碼競賽(LiveCodeBench v5)公開測評集上,MiMo 僅用 7B 的參數規模,超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview。

  隨着DeepSeek-R1引發業界強化學習(RL)共創潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成爲廣泛使用的強化學習起步模型。在相同RL訓練數據情況下,MiMo-7B 的數學&代碼領域的強化學習潛力顯著領先。

  值得注意的是,MiMo-7B全系列模型均已開源。據瞭解,MiMo 來自小米全新成立不久的“小米大模型Core團隊”的初步嘗試。(閆妍)

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:郝欣煜

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10