登顶全球最强开源模型:阿里宣布开源Qwen3

财中社
Yesterday

  4月29日凌晨,阿里巴巴(BABA/09988)宣布,新一代通义千问大模型Qwen3正式发布并全部开源8款混合推理模型。

  该模型采用国内首创的混合推理架构,参数量仅为DeepSeek-R1的1/3,成本大幅下降,在数学推理、代码生成等核心指标超越DeepSeek-R1及OpenAI开源模型,登顶全球最强开源大模型榜单。

  Qwen3采用混合专家架构(MoE),总参数量235B,激活参数仅22B,其“快思考”与“慢思考”模式可根据需求动态分配算力,如秒级响应简单问题,多步骤处理复杂任务,显著降低推理成本。在数学(AIME25 81.5分)、代码(LiveCodeBench 70+分)、人类偏好对齐(ArenaHard 95.6分)等评测中,Qwen3均刷新纪录,部分指标甚至超越Grok3和OpenAI-o1。

  阿里此次开源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量实现上代Qwen2.5-32B模型性能,32B稠密模型跨级超越Qwen2.5-72B。全系支持“思考预算”配置,适配手机(4B)、汽车(8B)、企业级(32B)等场景。结合Qwen-Agent框架及MCP(模型上下文)协议,开发者可低代码调用工具功能,加速智能体(AI Agent)应用落地。

  据阿里2024年财报,截至2024年12月31日止9个月,云业务收入同比增长9%至879亿元,AI相关收入占比持续提升。Qwen3的开源将进一步增强阿里云对大模型企业的吸引力,推动其“模型即服务”(MaaS)生态扩张。

  目前,通义系列模型全球下载量超3亿次,衍生模型超10万,已超越美国Llama成为全球第一开源模型。

(文章来源:财中社)

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10