登顶全球最强开源模型:阿里宣布开源Qwen3

财中社
昨天

  4月29日凌晨,阿里巴巴(BABA/09988)宣布,新一代通义千问大模型Qwen3正式发布并全部开源8款混合推理模型。

  该模型采用国内首创的混合推理架构,参数量仅为DeepSeek-R1的1/3,成本大幅下降,在数学推理、代码生成等核心指标超越DeepSeek-R1及OpenAI开源模型,登顶全球最强开源大模型榜单。

  Qwen3采用混合专家架构(MoE),总参数量235B,激活参数仅22B,其“快思考”与“慢思考”模式可根据需求动态分配算力,如秒级响应简单问题,多步骤处理复杂任务,显著降低推理成本。在数学(AIME25 81.5分)、代码(LiveCodeBench 70+分)、人类偏好对齐(ArenaHard 95.6分)等评测中,Qwen3均刷新纪录,部分指标甚至超越Grok3和OpenAI-o1。

  阿里此次开源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量实现上代Qwen2.5-32B模型性能,32B稠密模型跨级超越Qwen2.5-72B。全系支持“思考预算”配置,适配手机(4B)、汽车(8B)、企业级(32B)等场景。结合Qwen-Agent框架及MCP(模型上下文)协议,开发者可低代码调用工具功能,加速智能体(AI Agent)应用落地。

  据阿里2024年财报,截至2024年12月31日止9个月,云业务收入同比增长9%至879亿元,AI相关收入占比持续提升。Qwen3的开源将进一步增强阿里云对大模型企业的吸引力,推动其“模型即服务”(MaaS)生态扩张。

  目前,通义系列模型全球下载量超3亿次,衍生模型超10万,已超越美国Llama成为全球第一开源模型。

(文章来源:财中社)

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10