通義最強代碼AI模型Qwen3-Coder發佈性能直追Claude Sonnet 4

鳳凰網科技訊 7月23日，今日，通義Qwen系列大模型迎來了其在代碼能力上的重要更新，專爲Agent能力打造的全新代碼模型Qwen3-Coder正式發佈。此次率先亮相的是該系列中最強大的版本——Qwen3-Coder-480B-A35B-Instruct，這是一款採用混合專家（MoE）架構的大模型，旨在重塑AI在真實軟件工程環境中的應用範式。

據介紹，Qwen3-Coder在覈心能力上實現了多項突破。該模型原生便支持256K token的超長上下文窗口，並通過YaRN技術可擴展至1M token，使其能夠輕鬆處理倉庫級的代碼庫或複雜的動態數據（如Pull Request），這爲其強大的代理能力奠定了基礎。在性能方面，官方信息顯示，Qwen3-Coder在多個關鍵的代理式任務評測中，包括代理式編碼（Agentic Coding）、瀏覽器使用（Agentic Browser-Use）和工具調用（Agentic Tool-Use），均取得了當前開源模型的SOTA（業界最佳）效果，其綜合表現甚至可以與業界頂尖的閉源模型Claude Sonnet 4相媲美。

爲了充分發揮新模型的潛力，團隊還同步推出了一款配套的命令行工具Qwen Code。該工具在Gemini Code的基礎上進行了二次開發，通過深度的prompt和工具調用協議適配，能夠最大化激發Qwen3-Coder在執行復雜編程任務時的代理表現。同時，模型本身保持了開放性，可以與社區中流行的編程工具（如Claude Code、Cline等）結合使用。

此次Qwen3-Coder在能力上的躍升，得益於其在訓練方法上的深度創新。在預訓練階段，團隊使用了總計高達7.5T token的海量數據，其中代碼數據佔比達到70%。更值得關注的是，團隊並未沿用社區普遍聚焦於編程競賽題的訓練路徑，而是選擇了在更廣泛、更真實的軟件工程任務上，大規模應用強化學習（RL）。通過構建一個可同時運行兩萬個獨立環境的龐大驗證系統，模型得以在多輪交互中自主規劃、調用工具並從反饋中學習，最終在衡量真實世界軟件問題解決能力的SWE-bench Verified榜單上，實現了開源模型的最佳成績。這一系列技術突破，標誌着AI代碼模型正從單純的代碼生成器，向能夠自主解決複雜工程問題的“AI軟件工程師”加速演進。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

通義最強代碼AI模型Qwen3-Coder發佈性能直追Claude Sonnet 4

熱議股票

通義最強代碼AI模型Qwen3-Coder發佈 性能直追Claude Sonnet 4

熱議股票

通義最強代碼AI模型Qwen3-Coder發佈性能直追Claude Sonnet 4