阿里巴巴通义团队用四连发的重磅出击,横扫Github开源榜单。
本周从7月22日到25日,阿里接连推出Qwen3-235B非思考版本、Qwen3-Coder编程模型、Qwen3-235B-A22B-Thinking-2507推理模型,以及WebSailor AI Agent框架,四款产品横扫基础模型、编程模型、推理模型和智能体领域的开源榜单。
权威机构Artificial Analysis更是直接评价:
非思考模型也能性能“爆表”
据硬AI,周二凌晨阿里巴巴通义千问团队推出非思考模式(Non-thinking)最新模型,命名为Qwen3-235B-A22B-Instruct-2507-FP8。
这款非思考模型在多项关键基准测试中表现出色。不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。
值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。
编程模型引发社区沸腾
7月23日发布的Qwen3-Coder更是在全球开发者社区引发轰动。
华尔街见闻此前提及,这款基于MoE架构的编程模型拥有480B总参数,35B激活参数,原生支持256K上下文,可扩展至1M。
在开发者最关注的SWE-bench Verified基准测试中,Qwen3-Coder取得了开源模型最佳表现。
模型在7.5万亿token规模上训练,其中包含70%代码数据,并通过长时程强化学习和2万个虚拟环境的大规模实战训练,在真实世界的多轮交互任务中展现出色能力。
阿里还推出了配套的命令行工具Qwen Code,为开发者提供了完整的编程解决方案。
科技界领袖纷纷为Qwen3-Coder点赞,例如Perplexity CEO Aravind Srinivas盛赞Qwen3-coder的实力:
推特创始人Jack Dorsey更是强调Qwen3和Goose——其Block公司开发的AI Agent框架,搭配使用的话非常棒:
AI Agent框架挑战闭源垄断
阿里通义实验室同期开源的WebSailor AI Agent框架,直接对标OpenAI的Deep Research产品。
这款框架在BrowseComp-en/zh测试中性能显著优于所有开源智能体,可媲美专属闭源模型。
WebSailor采用复杂任务生成和强化学习模块的双重技术架构。通过构建复杂知识图谱和动态采样策略,系统能够在海量信息中进行高效检索和推理。
除了在复杂任务上的卓越表现,WebSailor在简单任务上也表现出色。例如,在SimpleQA基准测试中,WebSailor的性能超过了所有其他模型产品。
该项目在GitHub已获得超过5000颗星,并曾拿下每日增长趋势第一名。
WebSailor的核心技术主要围绕复杂任务生成和强化学习模块展开,这两个模块相互配合,共同推动了开源智能体在复杂信息检索任务中的性能提升。
该框架的开源意义重大,打破了闭源系统在信息检索领域的垄断地位,为全球开发者提供了媲美Deep Research的开源解决方案。
推理模型登顶全球开源冠军
7月25日发布的Qwen3-235B-A22B-Thinking-2507成为本周最重磅的产品。
更详细的榜单表现来看,Qwen3推理模型相较于其他模型来看也毫不逊色(除了 R1,其他都是顶尖闭源模型)。
该模型采用MoE架构,总参数235B,激活参数22B,拥有94层结构和128个专家系统,原生支持262,144 tokens上下文长度。模型专为思考模式构建,默认聊天模板自动包含思考标签,为深度推理提供了强大支撑。
OpenRouter数据显示,阿里千问的API调用量在过去几天暴涨,已超过1000亿tokens,包揽最热门调用模型前三名。这一数据直接反映了市场对阿里开源模型的认可度。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.