鳳凰網科技訊 7月23日,今日,通義Qwen系列大模型迎來了其在代碼能力上的重要更新,專爲Agent能力打造的全新代碼模型Qwen3-Coder正式發佈。此次率先亮相的是該系列中最強大的版本——Qwen3-Coder-480B-A35B-Instruct,這是一款採用混合專家(MoE)架構的大模型,旨在重塑AI在真實軟件工程環境中的應用範式。
據介紹,Qwen3-Coder在覈心能力上實現了多項突破。該模型原生便支持256K token的超長上下文窗口,並通過YaRN技術可擴展至1M token,使其能夠輕鬆處理倉庫級的代碼庫或複雜的動態數據(如Pull Request),這爲其強大的代理能力奠定了基礎。在性能方面,官方信息顯示,Qwen3-Coder在多個關鍵的代理式任務評測中,包括代理式編碼(Agentic Coding)、瀏覽器使用(Agentic Browser-Use)和工具調用(Agentic Tool-Use),均取得了當前開源模型的SOTA(業界最佳)效果,其綜合表現甚至可以與業界頂尖的閉源模型Claude Sonnet 4相媲美。
爲了充分發揮新模型的潛力,團隊還同步推出了一款配套的命令行工具Qwen Code。該工具在Gemini Code的基礎上進行了二次開發,通過深度的prompt和工具調用協議適配,能夠最大化激發Qwen3-Coder在執行復雜編程任務時的代理表現。同時,模型本身保持了開放性,可以與社區中流行的編程工具(如Claude Code、Cline等)結合使用。
此次Qwen3-Coder在能力上的躍升,得益於其在訓練方法上的深度創新。在預訓練階段,團隊使用了總計高達7.5T token的海量數據,其中代碼數據佔比達到70%。更值得關注的是,團隊並未沿用社區普遍聚焦於編程競賽題的訓練路徑,而是選擇了在更廣泛、更真實的軟件工程任務上,大規模應用強化學習(RL)。通過構建一個可同時運行兩萬個獨立環境的龐大驗證系統,模型得以在多輪交互中自主規劃、調用工具並從反饋中學習,最終在衡量真實世界軟件問題解決能力的SWE-bench Verified榜單上,實現了開源模型的最佳成績。這一系列技術突破,標誌着AI代碼模型正從單純的代碼生成器,向能夠自主解決複雜工程問題的“AI軟件工程師”加速演進。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。