阿里AI四連發,橫掃全球開源榜單第一名

市場資訊
07-26

阿里巴巴通義團隊用四連發的重磅出擊,橫掃Github開源榜單。

本週從7月22日到25日,阿里接連推出Qwen3-235B非思考版本、Qwen3-Coder編程模型、Qwen3-235B-A22B-Thinking-2507推理模型,以及WebSailor AI Agent框架,四款產品橫掃基礎模型、編程模型、推理模型和智能體領域的開源榜單。

權威機構Artificial Analysis更是直接評價:

非思考模型也能性能“爆表”

據硬AI,週二凌晨阿里巴巴通義千問團隊推出非思考模式(Non-thinking)最新模型,命名爲Qwen3-235B-A22B-Instruct-2507-FP8。

這款非思考模型在多項關鍵基準測試中表現出色。不僅全面超越了Kimi-K2等頂級開源模型,甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。

值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)測評中表現卓越。這意味着模型在理解複雜指令、自主規劃、調用工具以完成任務的能力上,達到了一個新的高度。“主打Agent”,將是未來AI應用的核心競爭力。

編程模型引發社區沸騰

7月23日發佈的Qwen3-Coder更是在全球開發者社區引發轟動。

華爾街見聞此前提及,這款基於MoE架構的編程模型擁有480B總參數,35B激活參數,原生支持256K上下文,可擴展至1M。

在開發者最關注的SWE-bench Verified基準測試中,Qwen3-Coder取得了開源模型最佳表現。

模型在7.5萬億token規模上訓練,其中包含70%代碼數據,並通過長時程強化學習和2萬個虛擬環境的大規模實戰訓練,在真實世界的多輪交互任務中展現出色能力。

阿里還推出了配套的命令行工具Qwen Code,爲開發者提供了完整的編程解決方案。

科技界領袖紛紛爲Qwen3-Coder點贊,例如Perplexity CEO Aravind Srinivas盛讚Qwen3-coder的實力:

推特創始人Jack Dorsey更是強調Qwen3和Goose——其Block公司開發的AI Agent框架,搭配使用的話非常棒:

AI Agent框架挑戰閉源壟斷

阿里通義實驗室同期開源的WebSailor AI Agent框架,直接對標OpenAI的Deep Research產品。

這款框架在BrowseComp-en/zh測試中性能顯著優於所有開源智能體,可媲美專屬閉源模型。

WebSailor採用複雜任務生成和強化學習模塊的雙重技術架構。通過構建複雜知識圖譜和動態採樣策略,系統能夠在海量信息中進行高效檢索和推理。

除了在複雜任務上的卓越表現,WebSailor在簡單任務上也表現出色。例如,在SimpleQA基準測試中,WebSailor的性能超過了所有其他模型產品。

該項目在GitHub已獲得超過5000顆星,並曾拿下每日增長趨勢第一名。

WebSailor的核心技術主要圍繞複雜任務生成和強化學習模塊展開,這兩個模塊相互配合,共同推動了開源智能體在複雜信息檢索任務中的性能提升。

該框架的開源意義重大,打破了閉源系統在信息檢索領域的壟斷地位,爲全球開發者提供了媲美Deep Research的開源解決方案。

推理模型登頂全球開源冠軍

7月25日發佈的Qwen3-235B-A22B-Thinking-2507成爲本週最重磅的產品。

更詳細的榜單表現來看,Qwen3推理模型相較於其他模型來看也毫不遜色(除了 R1,其他都是頂尖閉源模型)。

該模型採用MoE架構,總參數235B,激活參數22B,擁有94層結構和128個專家系統,原生支持262,144 tokens上下文長度。模型專爲思考模式構建,默認聊天模板自動包含思考標籤,爲深度推理提供了強大支撐。

OpenRouter數據顯示,阿里千問的API調用量在過去幾天暴漲,已超過1000億tokens,包攬最熱門調用模型前三名。這一數據直接反映了市場對阿里開源模型的認可度。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10