4月29日凌晨,阿里巴巴(BABA/09988)宣佈,新一代通義千問大模型Qwen3正式發佈並全部開源8款混合推理模型。
該模型採用國內首創的混合推理架構,參數量僅為DeepSeek-R1的1/3,成本大幅下降,在數學推理、代碼生成等核心指標超越DeepSeek-R1及OpenAI開源模型,登頂全球最強開源大模型排行榜。
Qwen3採用混合專家架構(MoE),總參數量235B,激活參數僅22B,其「快思考」與「慢思考」模式可根據需求動態分配算力,如秒級響應簡單問題,多步驟處理複雜任務,顯著降低推理成本。在數學(AIME25 81.5分)、代碼(LiveCodeBench 70+分)、人類偏好對齊(ArenaHard 95.6分)等評測中,Qwen3均刷新紀錄,部分指標甚至超越Grok3和OpenAI-o1。
阿里此次開源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量實現上代Qwen2.5-32B模型性能,32B稠密模型跨級超越Qwen2.5-72B。全系支持「思考預算」配置,適配手機(4B)、汽車(8B)、企業級(32B)等場景。結合Qwen-Agent框架及MCP(模型上下文)協議,開發者可低代碼調用工具功能,加速智能體(AI Agent)應用落地。
據阿里2024年財報,截至2024年12月31日止9個月,雲業務收入同比增長9%至879億元,AI相關收入佔比持續提升。Qwen3的開源將進一步增強阿里雲對大模型企業的吸引力,推動其「模型即服務」(MaaS)生態擴張。
目前,通義系列模型全球下載量超3億次,衍生模型超10萬,已超越美國Llama成為全球第一開源模型。
(文章來源:財中社)