阿里通义Qwen3.5-Max-Preview亮相国际大模型竞技场

IT之家
03/20

IT之家 3 月 20 日消息,阿里千问大模型家族再迎新成员。今日,Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版,在全球大模型竞技平台 LM Arena 正式亮相,并获得 1464 分的综合得分。

凭借这一成绩,阿里千问在 LM Arena 全球大模型公司排行榜中的排名上升至全球第五位,位列中国公司首位。

据阿里云介绍,LM Arena 是由国际开源研究机构 LMSYS 组织的第三方大模型评测平台,其评测机制采用模型两两匿名对战,由全球开发者进行盲测投票,最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。

在本次评测中,Qwen3.5-Max-Preview 在没有风格控制(without style control)的绝对胜率比拼中,整体性能排名全球第六。在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相也是千问 3.5 系列首次以旗舰级模型身份参与国际第三方评测。

IT之家注意到,自除夕以来,阿里千问今年已陆续开源 Qwen3.5 系列的多款模型,覆盖从 0.8B 到 397B 共 8 种不同参数规模,各尺寸模型均在同参数量级上取得领先性能。

其中,Qwen3.5-Plus 采用总参数 3970 亿、激活参数 170 亿的架构设计,以较小的激活参数实现了优于部分参数量更大模型的性能表现。此次亮相的 Qwen3.5-Max-Preview 是该系列旗舰模型的预览版本,后续将根据社区反馈持续优化迭代。

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10