通义最强代码AI模型Qwen3-Coder发布 性能直追Claude Sonnet 4

凤凰网科技
23 Jul

凤凰网科技讯 7月23日,今日,通义Qwen系列大模型迎来了其在代码能力上的重要更新,专为Agent能力打造的全新代码模型Qwen3-Coder正式发布。此次率先亮相的是该系列中最强大的版本——Qwen3-Coder-480B-A35B-Instruct,这是一款采用混合专家(MoE)架构的大模型,旨在重塑AI在真实软件工程环境中的应用范式。

据介绍,Qwen3-Coder在核心能力上实现了多项突破。该模型原生便支持256K token的超长上下文窗口,并通过YaRN技术可扩展至1M token,使其能够轻松处理仓库级的代码库或复杂的动态数据(如Pull Request),这为其强大的代理能力奠定了基础。在性能方面,官方信息显示,Qwen3-Coder在多个关键的代理式任务评测中,包括代理式编码(Agentic Coding)、浏览器使用(Agentic Browser-Use)和工具调用(Agentic Tool-Use),均取得了当前开源模型的SOTA(业界最佳)效果,其综合表现甚至可以与业界顶尖的闭源模型Claude Sonnet 4相媲美。

为了充分发挥新模型的潜力,团队还同步推出了一款配套的命令行工具Qwen Code。该工具在Gemini Code的基础上进行了二次开发,通过深度的prompt和工具调用协议适配,能够最大化激发Qwen3-Coder在执行复杂编程任务时的代理表现。同时,模型本身保持了开放性,可以与社区中流行的编程工具(如Claude Code、Cline等)结合使用。

此次Qwen3-Coder在能力上的跃升,得益于其在训练方法上的深度创新。在预训练阶段,团队使用了总计高达7.5T token的海量数据,其中代码数据占比达到70%。更值得关注的是,团队并未沿用社区普遍聚焦于编程竞赛题的训练路径,而是选择了在更广泛、更真实的软件工程任务上,大规模应用强化学习(RL)。通过构建一个可同时运行两万个独立环境的庞大验证系统,模型得以在多轮交互中自主规划、调用工具并从反馈中学习,最终在衡量真实世界软件问题解决能力的SWE-bench Verified榜单上,实现了开源模型的最佳成绩。这一系列技术突破,标志着AI代码模型正从单纯的代码生成器,向能够自主解决复杂工程问题的“AI软件工程师”加速演进。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10