DeepSeek之后首个!进击的MiniMax

市场资讯
20 Jun

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

历经两年多的狂飙突进,国内大模型行业正在快速收拢。随着DeepSeek的横空出世,竞争格局也发生了改变,国产大模型六小虎中多家进行战略调整、放弃模型预训练,互联网大厂也在发挥资源优势进击、转向布局自己更擅长的领域。

在这个过程中,是否要拥抱DeepSeek来增强自己的基模实力,是横亘在所有模型厂商面前的一道选择题。6月17日起,大模型六小虎之一Minimax开启连续5天的新品发布,首日就推出了用不同于字节、DeepSeek的强化学习方法训练的全球首个开源混合架构推理模型MiniMax-M1。由此开始,Minimax也陆续交出了自己在DeepSeek大火这几个月来筹备的新品,包括能生成AI视频行业目前最高难度运动场景的新视频生成模型Hailuo 02和MiniMax Agent、视频Agent等产品。

DeepSeek向前走了一步,但前面还有很多步,MiniMax正在做出尝试。

MiniMax开启5天上新周

其中,文本新模型MiniMax-M1是世界上首个开源的大规模混合架构的推理模型。MiniMax方面表示,M1在面向生产力的复杂场景中是全球开源模型中的最好一档,超过国内的闭源模型,接近海外的最领先模型的同时又有业内最高的性价比。目前,MiniMax以业内最低的价格在官网提供M1模型的API服务。

MiniMax在技术报告中提到,M1的一个显著优势是支持目前业内最高的“100万”上下文的输入,这个上下文输入量等同于闭源模型里Google Gemini 2.5 Pro的输入量,也是DeepSeek R1的8倍之多。在推理输出量上,M1目前也达到了业内最长的8万Token。

根据公开资料整理

据悉,输入长度的提升也主要得益于MiniMax独创的以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。这个特性使得在训练和推理的时候都有很大的算力效率优势。

MiniMax-M1发布后引起了开发者的广泛探讨。其中,著名AI博主MinChoi评论称,MiniMax-M1简直可以说集Manus 、Deep Research、计算机技能和可爱于一体,随即他还展出了自己用MiniMax-M1做的10个有趣案例。知名AI博主、佐治亚理工学院机器学习博士生Aran Komatsuzaki在M1发布后表示,M1是目前开源模型中拥有460亿活跃参数、接近最先进推理能力和代理能力的大语言模型,机器学习爱好者Vaibhav (VB) Srivastav也提到,在上下文长度上M1完全击败了DeepSeek R1和Qwen 235B。

MiniMax-M1发布后引起海外科技圈热议。

除了新模型MiniMax-M1以外,此次发布周MiniMax抛出的另一张王牌是新视频生成模型Hailuo 02。在视频领域,MiniMax一直有着一定的统治力,早在2024年8月MiniMax就推出了海螺AI旗下的文本转视频模型Video-01,今年1月海螺AI推出最新自研S2V-01主体参考视频模型,解决了AI视频创作主体人物角色一致性的最大卡点。从2024年11月份到2025年3月,海螺视频/Hailuo AI的月访问量全球第一,力压Sora、Runway等海外外AI视频产品。

MiniMax称,此次最新发布的Hailuo 02在复杂指令遵循和复杂物理表现方面特别出色,既可以完整响应一些相当复杂的指令,又可以让仔细编写的prompt得到更好的反馈。根据生成的demo可以看到,在AI视频超难做好的如体操、杂技等考验主体动作丝滑度、连贯度的场景中,Hailuo 02也能完整、连贯体现,甚至连光影变化都能处理。在价格上,目前Hailuo 02价格也低于Runway、Sora等视频生成模型。

输入“画面中人物快速抛接球体,彩带飘动落下,人物不停抛接球体”后生成的视频。

DeepSeek之后基础大模型仍有创新空间

历经两年多的狂飙突进,大模型行业正在快速收拢。在海外,大模型决赛圈被收拢至OpenAI、谷歌Meta、Anthropic和xAI五家公司,各家的发布也呈现你追我赶的态势。就在近期,谷歌刚带着Gemini 2.5 Pro刷新在数学、编程、推理基准测试中的SOTA力压OpenAI的o3、Claude 4等模型,一周后OpenAI快速推出o3-pro,并做到在智力水平上领先Gemini 2.5 pro。

在国内,随着DeepSeek的横空出世,竞争格局也发生了改变。其中,国产大模型六小虎中多家进行战略调整、放弃模型预训练,其中百川智能聚焦医疗、零一万物拥抱DeepSeek提供部署的专门定制解决方案并押注行业落地。

同时,互联网大厂也在发挥资源优势继续进击。根据相关证券报告,2025年字节跳动资本开支有望达到1600亿元,较去年的800亿翻了整整一倍;而阿里巴巴集团CEO吴泳铭则在今年2月的2025财年第三季度财报分析师电话会上宣布,未来三年,阿里将在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入,其中未来三年在云和AI的基础设施投入预计将超越过去十年的总和。

在国际和国内竞争加剧情况下MiniMax也成为了为数不多仍在坚持基础模型研发的企业。

成立三年多来,MiniMax一直勇当“第一个吃螃蟹的人”。2023年下半年,当大部分国内大模型厂商还在继续迭代稠密dense模型之际,MiniMax率先投入大量资源研究MoE架构,并于2024年1月上线国内首个MoE大模型abab6,MoE架构后续彻底取代稠密架构成了大模型领域技术迭代的行业共识,这也是今年年初爆火出圈的DeepSeek使用的主要架构。

这一次,Minimax也以创新的方式试图改变DeepSeek-R1出现后形成的竞争格局。在此次发布的MiniMax-M1模型中,MiniMax继续创新地使用线性注意力Lightning Attention机制,同时也创造了一种名为CISPO(Clipped IS-weight Policy Optimization)的全新强化学习方法,更好地保留了长推理链条中的关键转折点,提高了学习效率与稳定性。技术报告显示,CISPO算法比包括字节近期提出的DAPO等强化学习算法收敛性能快了一倍,并显著的优于DeepSeek早期使用的GRPO。

知名数字经济学者、工信部信息通信经济专家委员会委员盘和林表示,在此次的新模型中,MiniMax的主要贡献还是在闪电注意力这一大模型算法改进上,之前其他大模型采用PPO/GRPO采用的“裁剪”方式有一些缺陷,MiniMax则通过CISPO对这些缺陷进行了一些优化,其目的还是为了降低训练成本和推理成本,这是进步,但这个进步如何转化为商业价值还需要在应用层面的具体实践。

盘和林还提到,现阶段的基础模型依然有很大的提升空间,这就是加码大模型的创业公司的机会。“很多用户并不喜欢用AI来干活,大模型一定还是有优化空间的,谁找对了大模型算法优化的方向,谁就是下一个科技巨头。deepseek向前走了一步,但还不够。”

备战下一个共识Agent时代

在产品发布周“打头阵”的MiniMax-M1技术报告中,MiniMax提到,“与最新的DeepSeek-R1-0528模型相比,MiniMax-M1在数学和编码竞赛中接近

DeepSeek R1-0528,而在更现实的工具使用和长上下文场景中实现了可比或更优的性能。值得注意的是,MiniMax-M1在代理工具使用基准TAU-Bench上优于Gemini 2.5 Pro,并在长上下文理解基准上超过了OpenAI o3和Claude 4 Opus。通过有效的测试时间扩展,我们认为MiniMax-M1为下一代语言模型Agent解决现实世界挑战奠定了坚实的基础。”

各家模型在“人工分析智能指数”上的表现,MiniMax-M1作为开源模型表现优异。

看到这里不难能意识到,MiniMax已经准备好参与大模型的下一个风口Agent。今年随着Manus等智能体产品的爆火,Agent已经成为科技圈继大模型以后的第二个共识。更高效的推理和规划能力、更长的推理时间和更便宜的价格,都是Agent能顺利落地的重要因素。

除了准备好了一个更好的基底大模型来承接Agent爆发的需求,6月19日MiniMax也发布了一个能完成长程(Long Horizon)复杂任务的通用智能体,该智能体能多步规划出专家级解决方案、灵活拆解任务需求、执行多个子任务从而交付最终结果。据悉在MiniMax内部,该产品已经被使用了两个月,逐渐成为内部超过50%的同学日常使用的产品。

MiniMax Agent主打的点是“靠谱”,在研发过程中按照“靠谱的人”的标准来设计和要求Agent,比如在编程能力上包含复杂跳转逻辑、能做全面测试从而不交付有bug的网页;在多模态方面除了支持长文本文件也支持视频、音频、图片等理解能力,也支持生成图文音并茂的作品;同时支持MCP扩展、开放并包。用户可以用它来完成做动画、广告片、简易ppt等任务。

今年4月底,MiniMax创始人、CEO闫俊杰在一次高层调研活动中汇报了MiniMax内部正在研发的智能体的技术创新点和应用场景,展示现场的白板上提到,未来智能体的模态内容从文本到多模态融合、智能体能执行任务的复杂度将从普通人半天工作量到专业人士一周工作量。

一个多月后,MiniMax Agent的正式发布,正是对这份规划的郑重“交卷”。从“解放大脑”到“解放手脚”,从聪明的“聊天伴侣”到“靠谱的生产力工具”,MiniMax Agent的发布,为AI行业的发展注入了一剂强心针。

可以看到,MiniMax新模型M1选择在进一步优化推理成本和Agent上发力,以创新方式调优结构、提高效率,叠加在视频模型上的优势,MiniMax再次搅动了大模型公司的格局。基础模型、Agent和视频模型也成为了MiniMax未来能否拿到AI时代一张船票的关键所在。

文/林文琪

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10