登頂全球最強開源模型:阿里宣佈開源Qwen3

財中社
04/30

  4月29日凌晨,阿里巴巴(BABA/09988)宣佈,新一代通義千問大模型Qwen3正式發佈並全部開源8款混合推理模型。

  該模型採用國內首創的混合推理架構,參數量僅為DeepSeek-R1的1/3,成本大幅下降,在數學推理、代碼生成等核心指標超越DeepSeek-R1及OpenAI開源模型,登頂全球最強開源大模型排行榜。

  Qwen3採用混合專家架構(MoE),總參數量235B,激活參數僅22B,其「快思考」與「慢思考」模式可根據需求動態分配算力,如秒級響應簡單問題,多步驟處理複雜任務,顯著降低推理成本。在數學(AIME25 81.5分)、代碼(LiveCodeBench 70+分)、人類偏好對齊(ArenaHard 95.6分)等評測中,Qwen3均刷新紀錄,部分指標甚至超越Grok3和OpenAI-o1。

  阿里此次開源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量實現上代Qwen2.5-32B模型性能,32B稠密模型跨級超越Qwen2.5-72B。全系支持「思考預算」配置,適配手機(4B)、汽車(8B)、企業級(32B)等場景。結合Qwen-Agent框架及MCP(模型上下文)協議,開發者可低代碼調用工具功能,加速智能體(AI Agent)應用落地。

  據阿里2024年財報,截至2024年12月31日止9個月,雲業務收入同比增長9%至879億元,AI相關收入佔比持續提升。Qwen3的開源將進一步增強阿里雲對大模型企業的吸引力,推動其「模型即服務」(MaaS)生態擴張。

  目前,通義系列模型全球下載量超3億次,衍生模型超10萬,已超越美國Llama成為全球第一開源模型。

(文章來源:財中社)

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10