阿里AI四連發，橫掃全球開源榜單第一名

市場資訊

07-26

阿里巴巴通義團隊用四連發的重磅出擊，橫掃Github開源榜單。

本週從7月22日到25日，阿里接連推出Qwen3-235B非思考版本、Qwen3-Coder編程模型、Qwen3-235B-A22B-Thinking-2507推理模型，以及WebSailor AI Agent框架，四款產品橫掃基礎模型、編程模型、推理模型和智能體領域的開源榜單。

權威機構Artificial Analysis更是直接評價：

非思考模型也能性能“爆表”

據硬AI，週二凌晨阿里巴巴通義千問團隊推出非思考模式（Non-thinking）最新模型，命名爲Qwen3-235B-A22B-Instruct-2507-FP8。

這款非思考模型在多項關鍵基準測試中表現出色。不僅全面超越了Kimi-K2等頂級開源模型，甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。

值得一提的是，本次更新的Qwen3模型在Agent能力尤其亮眼：在BFCL（Agent能力）測評中表現卓越。這意味着模型在理解複雜指令、自主規劃、調用工具以完成任務的能力上，達到了一個新的高度。“主打Agent”，將是未來AI應用的核心競爭力。

編程模型引發社區沸騰

7月23日發佈的Qwen3-Coder更是在全球開發者社區引發轟動。

華爾街見聞此前提及，這款基於MoE架構的編程模型擁有480B總參數，35B激活參數，原生支持256K上下文，可擴展至1M。

在開發者最關注的SWE-bench Verified基準測試中，Qwen3-Coder取得了開源模型最佳表現。

模型在7.5萬億token規模上訓練，其中包含70%代碼數據，並通過長時程強化學習和2萬個虛擬環境的大規模實戰訓練，在真實世界的多輪交互任務中展現出色能力。

阿里還推出了配套的命令行工具Qwen Code，爲開發者提供了完整的編程解決方案。

科技界領袖紛紛爲Qwen3-Coder點贊，例如Perplexity CEO Aravind Srinivas盛讚Qwen3-coder的實力：

推特創始人Jack Dorsey更是強調Qwen3和Goose——其Block公司開發的AI Agent框架，搭配使用的話非常棒：

AI Agent框架挑戰閉源壟斷

阿里通義實驗室同期開源的WebSailor AI Agent框架，直接對標OpenAI的Deep Research產品。

這款框架在BrowseComp-en/zh測試中性能顯著優於所有開源智能體，可媲美專屬閉源模型。

WebSailor採用複雜任務生成和強化學習模塊的雙重技術架構。通過構建複雜知識圖譜和動態採樣策略，系統能夠在海量信息中進行高效檢索和推理。

除了在複雜任務上的卓越表現，WebSailor在簡單任務上也表現出色。例如，在SimpleQA基準測試中，WebSailor的性能超過了所有其他模型產品。

該項目在GitHub已獲得超過5000顆星，並曾拿下每日增長趨勢第一名。

WebSailor的核心技術主要圍繞複雜任務生成和強化學習模塊展開，這兩個模塊相互配合，共同推動了開源智能體在複雜信息檢索任務中的性能提升。

該框架的開源意義重大，打破了閉源系統在信息檢索領域的壟斷地位，爲全球開發者提供了媲美Deep Research的開源解決方案。

推理模型登頂全球開源冠軍

7月25日發佈的Qwen3-235B-A22B-Thinking-2507成爲本週最重磅的產品。

更詳細的榜單表現來看，Qwen3推理模型相較於其他模型來看也毫不遜色（除了 R1，其他都是頂尖閉源模型）。

該模型採用MoE架構，總參數235B，激活參數22B，擁有94層結構和128個專家系統，原生支持262,144 tokens上下文長度。模型專爲思考模式構建，默認聊天模板自動包含思考標籤，爲深度推理提供了強大支撐。

OpenRouter數據顯示，阿里千問的API調用量在過去幾天暴漲，已超過1000億tokens，包攬最熱門調用模型前三名。這一數據直接反映了市場對阿里開源模型的認可度。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

阿里AI四連發，橫掃全球開源榜單第一名

熱議股票