阿里通义Qwen3.5-Max-Preview亮相国际大模型竞技场

IT之家
Mar 20

IT之家 3 月 20 日消息,阿里千问大模型家族再迎新成员。今日,Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版,在全球大模型竞技平台 LM Arena 正式亮相,并获得 1464 分的综合得分。

凭借这一成绩,阿里千问在 LM Arena 全球大模型公司排行榜中的排名上升至全球第五位,位列中国公司首位。

据阿里云介绍,LM Arena 是由国际开源研究机构 LMSYS 组织的第三方大模型评测平台,其评测机制采用模型两两匿名对战,由全球开发者进行盲测投票,最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。

在本次评测中,Qwen3.5-Max-Preview 在没有风格控制(without style control)的绝对胜率比拼中,整体性能排名全球第六。在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相也是千问 3.5 系列首次以旗舰级模型身份参与国际第三方评测。

IT之家注意到,自除夕以来,阿里千问今年已陆续开源 Qwen3.5 系列的多款模型,覆盖从 0.8B 到 397B 共 8 种不同参数规模,各尺寸模型均在同参数量级上取得领先性能。

其中,Qwen3.5-Plus 采用总参数 3970 亿、激活参数 170 亿的架构设计,以较小的激活参数实现了优于部分参数量更大模型的性能表现。此次亮相的 Qwen3.5-Max-Preview 是该系列旗舰模型的预览版本,后续将根据社区反馈持续优化迭代。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10