霸榜全球大模型,MiniMax凭什么力压Claude、GPT?

阿尔法工场研究院
Mar 12

导语:一款“不是最聪明”的模型,能让全球开发者用脚投票。

MiniMax M2.5连续霸榜全球!

OpenRouter实时数据显示,这款由Minimax在2月12日发布的模型,自发布以来一个月,始终居于全球大模型周调用量排行榜第一。

它压过的,不是一些普通模型,而是Gemini、DeepSeek、Claude等旗舰模型。

来源:OpenRouter LLM Leaderboard(2026.2.12-2026.3.12)

这个榜单的特别之处在于,它不是实验室跑分,也不是社交媒体热度,而是OpenRouter基于数百万用户真实使用数据形成的排名。

为什么一款“不是最聪明”的模型,能让全球开发者用脚投票?

MiniMax为何全球第一?

很多人第一反应,MiniMax M2.5是靠便宜赢的。

相较于美国大模型,它的确是“价格屠夫”。

OpenRouter实时定价显示:

  • MiniMax M2.5:输入0.27美元/百万Token,输出0.95美元/百万Token。

  • Claude Opus 4.6:输入5美元/百万Token(约18倍)、输出25美元/百万Token(约26倍)。

一位海外开发者在X上算了一笔账:“跑OpenClaw连续1小时(100 TPS),MiniMax M2.5只要1美元;换Claude一天可能烧几百美元。”

还有网友将MiniMax M2.5称为“Claude Opus 95%性能的便宜版”,表示“差距不是钱,是生存”。

正是这种“用得起”的门槛,把MiniMax M2.5推上了榜首。

但MiniMax M2.5不只是便宜,真正特别的地方在于,这是一款从一开始就不是为“聊天”设计的模型,而是为编程、工具使用、搜索、办公这些真实工作流去做的。

过去很长时间,大模型最主要的使用方式还是聊天、问答、写作辅助,模型之间拼的是谁回答得更自然、推理更强、综合能力更高。

但到了今年,增长最快的一类需求已经变成了Agent(智能体):让模型能自己去搜资料、调工具、改代码、读网页、写文档、跑流程。

OpenRouter的AI应用榜单,清晰地呈现了这种变化。

最近一个月,排在最前面的就是OpenClaw,累计消耗9.62T tokens;紧接着是Kilo Code的5.06T tokens、BLACKBOXAI的2.01T tokens,清一色都是Agent(智能体)产品。

来源:OpenRouter Top Apps(2026.2.12-2026.3.12)

在这样的背景下,MiniMax M2.5的胜出就不难理解了。

MiniMax M2.5采用MoE架构,推理速度快、延迟低,上下文窗口197K,完美匹配Agent长工作流。

在Agent场景里,一个任务要连续调用很多轮,价格差会被成倍放大。

而MiniMax M2.5刚好适合Agent,而且更便宜,完美满足了Agent“高频调用、低成本执行”的需求曲线。

Reddit和LocalLLaMA社区,开发者们的实测反馈好评如潮:“像Claude Sonnet一样懂工具调用,但多步工作流干净太多”、“它是OpenClaw的主模型,性价比直接把Claude干掉”。

更巧合的是,MiniMax M2.5发布正值开源Agent框架OpenClaw爆发。

MiniMax官方率先上线“OpenClaw专区”教程,OpenClaw文档甚至把MiniMax M2.5列为推荐模型。

在这一波“养龙虾”热潮中,MiniMax直接吃到了OpenClaw爆发的红利。

数据显示,OpenClaw正是MiniMax M2.5月调用量最大的单一应用贡献者之一。OpenClaw的爆发,进一步把MiniMax M2.5推上了神坛。

MiniMax霸榜是昙花一现吗?

如果说MiniMax M2.5吃到的是短期流量,那么大概率很快就会回落。但它现在踩中的,是AI应用的主方向。

无论是MiniMax,还是DeepSeek、Kimi、阶跃星辰、Google、Anthropic、OpenAI,全球各大模型公司都在押注Agent,这条路线已经越来越成为行业共识。

对于押对了方向的MiniMax来说,显然具备先发优势。

一旦开发团队围绕MiniMax M2.5,把prompt、tool calling、长上下文处理、多步执行和成本预算跑顺了,切换到其他模型就不只是“换一个脑子”那么简单,而是整套工作流和账单都要重算。

除非替代者明显好很多,否则很多开发者并没有足够动力为一小截性能提升,去承受更高的成本或重新调试的麻烦。

当然,这种优势能不能持续,还要看MiniMax自己是不是跑得够快。

官方模型更新记录显示,2025年12月,MiniMax的模型还是M2.1,到了2026年2月已经发布了M2.5,迭代速度显著超越Anthropic、OpenAI、Google等海外巨头。

这意味着MiniMax在很短的周期内强化了开发者最在意的能力,M2.5的升级方向也清楚地表明在往Agent密集的场景去打磨。

尽管如此,一场围绕Agent的模型混战已经开始加速。

OpenRouter最新公开榜单上,Step 3.5 Flash、Gemini 3 Flash Preview、DeepSeek V3.2、Claude Opus 4.6都在拼命追赶。

比如,阶跃星辰(Step 3.5 Flash)的优势非常直接:免费。

这个策略的杀伤力很强,因为大量开发者和团队还处在试验期,Agent工作流也远没有完全定型,谁能先把试用门槛打到最低,谁就更容易把人拉进来。正因如此,Step 3.5 Flash的调用量迅速抬升。

再比如,Kimi K2.5,它的定位和M2.5一样,明显不是只做聊天,而是朝复杂工作流、工具调用和长链路任务,也在争夺同一类Agent/研究/编程的用户。

所以接下来,MiniMax要拼的不是在榜单上冲得更快,而是能不能把“调用量”沉淀为“Agent默认选项”,并将其变成长期的真金白银。

模型霸榜能转化为商业回报吗?

事实上,MiniMax的商业化能力一直为外界称道。

在“大模型烧钱”的普遍焦虑里,MiniMax率先证明了大模型未必只能在“收入增长”和“大幅亏损”之间二选一。

2025年,MiniMax收入同比增长158.9%至7904万美元,经调整净亏损为2.509亿美元,仅同比增加2.7%,毛利率则从12.2%提升到25.4%。

对比同样在港股上市的智谱,后者2025年上半年收入1.909亿元人民币,但经调整净亏损达到17.52亿元人民币,亏损强度明显更高。

在目前已披露数据范围内,MiniMax的经营效率改善更早显现出来。

再来看MiniMax的收入结构。

其中一块是AI-native products(面向终端用户,如海螺AI、Talkie等产品),2025年收入约为5310万美元,占比约2/3。

另一块是Open Platform和其他企业服务(面向B端用户,如模型API、开放平台、企业定制等),2025年收入约2596万美元,占比约1/3。

这表明,MiniMax不是只靠一个榜单上的热门模型赚钱,也不是只靠单一App变现,而是把模型能力同时接进了前台产品和后台平台服务两条线。

MiniMax M2.5作为现阶段最能打的主力大模型,不只是抬高MiniMax自家产品矩阵的能力上限,还在推着平台收入往上长。

2026年前两个月,MiniMax的业务进展已呈现出明显加速态势,模型调用量与新增用户规模均出现跃升。数据显示,M2系列文本模型在2026年2月的平均单日Token消耗量已较2025年12月增长6倍以上。

这恰恰是MiniMax商业化里最值得注意的一点。

很多模型公司也有热度,也能在开发者圈里冲出一轮声量,但最后掉下去,问题往往不是模型不够强,而是它们没有把模型能力转换成一个可收费的商业闭环。

MiniMax不一样,它披露自己70%以上收入来自国际市场,2025年的增长很大程度也来自中国以外的销售。

这表明MiniMax不是只在中国开发者或中文互联网里热,而是已经在更大范围里被用户买单。

资本市场显然也看到了这一点。3月10日收盘,MiniMax市值首次超过百度

结语

MiniMax M2.5这轮霸榜,真正值得关注的是并不是排名,而是大模型行业的比赛规则正在改变。

2026年,市场已经在用另一套更现实的标准投票:谁更适合接进Agent,谁能把成本打下来,谁能让开发者和企业真的用起来?

某种意义上,这场比赛比的已经不是谁更像未来,而是谁更早把未来做成生意。

#大模型 #MiniMax #Anthropic #OpenAI #Google

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10