阿里發布千問3.5:統一品牌架構,3970億參數模型僅激活170億

DoNews
03/05

2026年2月5日,阿里巴巴集團完成AI品牌戰略整合,將旗下所有大模型統一命名為「千問」。2月16日(農曆除夕),阿里正式開源Qwen3.5,首次實現原生多模態能力,在視覺理解、複雜推理與Agent智能體等維度全部納入統一預訓練架構。

Qwen3.5-Plus總參數量為3970億,推理時僅激活170億參數,激活率不足5%,在多項基準測試中性能媲美GPT-5.2、Gemini-3-pro等閉源第一梯隊模型,並超越阿里上一代萬億參數的Qwen3-Max。其API價格僅為同等性能Gemini 3 Pro的1/18,部署顯存佔用較上一代降低60%,最大推理吞吐量提升至19倍。

該模型延續Qwen系列「以小勝大」技術路線:從Qwen1.5的0.5B–110B全參數譜系,到Qwen2.5以72B參數超越Llama3 405B,再到Qwen3.5將該能力拓展至多模態領域。其採用聯合文本與視覺混合數據的端到端預訓練,避免外掛式視覺模塊導致的語言能力下降,支持像素級圖像定位、2小時視頻時序理解、手繪草圖轉前端代碼及跨設備視覺智能體操控。

核心技術包括混合注意力機制、極致稀疏MoE架構、原生多Token預測及注意力門控機制,實現動態計算資源分配與3970億參數知識庫的高效調用。實測顯示,模型可在OpenClaw環境中自動完成新AI模型搜索、信息整合、SWE-Bench基準對比分析、PDF排版生成並跨平台回傳。

Qwen3.5的性能與成本優勢源於阿里雲「模型—芯片—雲」全棧協同:平頭哥自研「真武」芯片針對MoE架構深度優化;阿里雲提供FP8/FP32混合精度策略,使激活內存減少約50%、訓練提速10%;專用大規模強化學習框架覆蓋純文本、多模態及多輪對話場景,訓練效率提升3–5倍。

截至2026年3月,千問開源模型超400個,衍生模型逾20萬個,下載量突破10億次。在中國企業級大模型調用市場中,千問位居第一,成為阿里雲新增需求主要驅動力。Omdia數據顯示,2025年上半年中國AI雲市場規模達223億元,阿里雲佔比35.8%,超過第二至第四名之和;其在中國整體雲市場份額由33%升至36%。

Apache 2.0協議完全開放的Qwen3.5,使全球開發者可零門檻使用、研究及二次開發頂級多模態AI能力。其技術路徑指向一個拐點:頂級AI能力正從高算力、高成本閉環轉向個人開發者、創業團隊與中小企業可觸達的基礎能力。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10