MiniMax 融资故事:4年7轮,谁在推动中国AI第一场资本盛宴

晚点LatePost
Jan 09

IPO 不是对胜者的奖赏,而是下一轮竞赛的鼓点。

文丨程曼祺

接连两天,大模型创业公司智谱和 MiniMax 港股 IPO。对比移动互联网的几次上市盛宴,大模型领域的 IPO 并不发生在大战告一段落之后。它不是对胜者的奖赏,而是下一轮竞赛的鼓点。

智谱和 MiniMax 前后脚登陆二级市场后,他们将开启更大规模的定增。这是一个商业化仍不确定、持续的研发投入却十分确定的领域。IPO 的实质意义是更高效地获得更多资源。

MiniMax 上市前夕,我们采访了 MiniMax 团队和他们的多位投资人,共同还原过去 3 年多里,市场对大模型创业机会的多种视角,以及这家公司的特质。

上市前的 7 轮融资中,30 家机构共投资 MiniMax 15 亿美元。阿里投了最多的钱;高瓴是第一轮领投方,按份额计算仅次于阿里,是第二大外部股东;明势参与了最多轮次。

在今天(1 月 9 日)早上前往港交所敲钟前,MiniMax 创始人闫俊杰对《晚点 LatePost》分享了他此刻的想法:

希望我们后续能有机会对整个行业智能水平的提升做出更大的贡献。我们初步探索了一条纯草根 AI 创业的路径,尽管后面还是非常挑战,如果能对 AI 创新创业生态的发展有启发我们会感到很光荣

截止午间收盘,MiniMax 股价较发行价 165 港元上涨超 78% 至 294 港元,市值达到 898 亿港元。

热潮前出发

高瓴:最早投资,最大的外部财务投资人

MiniMax 成立于 ChatGPT 热潮前夕的 2022 年初,高瓴是它的第一个投资人。

创业筹备期,在当时 MiniMax 的北京办公室,高瓴合伙人李良和闫俊杰、贠烨祎聊了 3 小时后,拿出了一张估值为空白的 TS(投资意向书):你们可以写一个想要的估值和投资金额。闫俊杰给出了计划中的数字:融资 3000 万美元,估值 2 亿美元。

创业前,闫俊杰和贠烨祎是商汤的同事。闫俊杰出生于 1989 年,在河南县城长大,博士毕业于中国科学院自动化所。在商汤的 7 年,闫俊杰从研究员成为商汤最年轻的副总裁,先后担任研究院执行院长,负责过智慧城市、游戏等业务;贠烨祎毕业于约翰斯·霍普金斯大学,曾任商汤 CEO 办公室战略负责人。

第一个接触到 MiniMax 的高瓴投资人薛子钊告诉《晚点 LatePost》,在与李良见面的前几天,闫俊杰给高瓴团队讲了一场 9 小时的 “技术课”:Transformer 架构模型的 Scaling Laws,GPT-3 的进展,DeepMind 做的强化学习,扩散模型带来的图像生成,CLIP 怎么把图像和语言结合到一起……“当时很少有人能把这些技术拼到一起。我个人也很难相信肯定能做出来,但事后看,IO(闫俊杰)写的这些判断都是对的。”

MiniMax 创立早期,团队在白板上拆解技术变化和市场机会。

MiniMax 的思路是同时做文本、语音和图像模型,以大模型和多模态技术做出可以服务普通人的 AI 应用。这是 MiniMax 成立时确立的愿景:Intelligence with everyone。

高瓴当时判断,这是一个系统工程,团队不仅要懂算法,还需要硬件底层、数据、工程和应用的综合能力。闫俊杰在商汤带过 1000 多人的团队,在算法、工程、组织和 AI 商业化上都有经验。

不到两周,高瓴走完了 TS、投决会,拿下 MiniMax 天使轮领投。稍晚一周接触到 MiniMax 的红杉没有投进这一轮,1 年半后的 2023 年 7 月,在投前 15.5 亿美元的第四轮融资中,红杉成为 MiniMax 股东。

2022 年 11 月,张磊组织了一次小范围的中东行,同行的少数企业家有亚迪创始人王传福和地平线创始人余凯,也有当时名不见经传、刚刚创业不到 1 年的闫俊杰。

在卡塔尔世界杯的 VIP 休息室里,闫俊杰用不太熟练的英语向中东朋友解释什么是 AGI(通用人工智能)。半个月后,这个当时还比较小众的词汇随 ChatGPT 发布传遍全球。最早接触 MiniMax 的高瓴投资人薛子钊在 2023 年正式加入 MiniMax:“把自己投进去了。”

高瓴在天使轮后多次投资 MiniMax,上市前,共计持有 MiniMax 7.14% 的股份,仅次于阿里,是 MiniMax 第二大的外部投资人和第一大财务投资人。

米哈游刘伟:“Super smart 被高估了,而韧性被低估了”

2021 年初,米哈游创始人蔡浩宇曾在一次演讲中说:想在 “2030 年打造 10 亿人生活在其中的虚拟世界”。MiniMax 最初设想的应用形态与之契合:用多模态技术做出和普通人交互的 AI 智能体(注:此处 “AI 智能体” 指 “AI 角色”,并非现在常说的 AI Agent)。米哈游三位创始人中的 “大伟哥” 刘伟和 “罗爷” 罗宇皓也与 MiniMax 团队相识已久,他们几乎和高瓴同时得知了闫俊杰创业的消息,投资顺其自然。

米哈游是那类创始人最喜欢的投资人。贠烨祎告诉《晚点 LatePost》:他们并不特别过问公司的运营细节,每次见面,更多聊 “人生道理”,这是基于相信团队。

闫俊杰亲历过上一轮 AI 热潮的起伏。“我经历过一年半一直输,也经历过做对之后,一直赢。” 闫俊杰近期与罗永浩的访谈中,回顾了在商汤做人脸识别时的波折,顶着巨大压力逆风追赶后,他有了更强的技术自信。

他也见证过整个计算机视觉时代,全行业高开低走的困顿。一位 AI 四小龙创始人曾如此评价闫俊杰:他吃过 AI 1.0 的苦。

去年有一次聊起大模型,刘伟对我们说:在大模型创业者中,Super smart 的部分总是被高估,而韧性总是被低估。但创业是长跑,韧性弥足珍贵。

云启、IDG 加入,天使轮收关

贠烨祎在商汤期间就与多位投资人相熟,包括约翰斯·霍普金斯的校友、云启管理合伙人陈昱,和曾经多轮投资过商汤的 IDG 合伙人牛奎光。

这两家机构很快加入了 MiniMax 的天使轮阵容。陈昱更早时就和闫俊杰、贠烨祎交流过技术趋势。当闫俊杰正式决定创业后,上海的一顿晚餐下来,陈昱当场说想投:“我想去赌一个有可能能够颠覆现有技术方案的路线,以前都是小模型,闫俊杰比较早看到了基础大模型的价值。”

牛奎光在米哈游、高瓴发出 TS 后不久联系了贠烨祎,上午电话,晚上就飞到上海与闫俊杰和核心团队面聊,很快敲定了投资。

整个天使轮,MiniMax 共融资 3100 万美元,估值 2 亿美元。这与团队最初的计划——融资 3000 万美元、投后估值 2 亿美元——相差无几。MiniMax 拒绝了拿更多钱、获得更高估值的提议。

明势:MiniMax 第二轮的唯一新股东,投资 MiniMax 轮数最多的机构

ChatGPT 发布前,MiniMax 有两轮融资,第二轮的唯一新股东是明势资本。明势创始合伙人黄明明和明势合伙人夏令第一次见到闫俊杰,是在北京的一个酒店大堂,当时闫俊杰拿着 iPad 正在看论文。直到现在,他依然保持尽量每天花 1 小时浏览新论文的习惯。

第一次见面聊了 2 个多小时,闫俊杰讲述的起点是技术变化。夏令第一次从闫俊杰口中听到 AGI,他一边聊,一边现场搜索。现在,很多人在同样情形下的第一反应已不再是百度一下,而是问 ChatGPT 或豆包。

“坦白说,当时对 AGI 没有很敏感,但他很快讲到了 GPT 是端到端数据驱动的模型。” 明势曾投资理想汽车 7 轮,自 2021 年起,智能驾驶领域的一大趋势就是端到端模型带来的大幅提升。

闫俊杰也聊了技术变化如何改变商业逻辑:上一批 AI 公司的长期难点是,当时的模型不够通用,针对不同场景和任务,往往需要重新训练模型。而大模型是 “One Model for all”(一个模型可以服务多种场景和任务),这意味着 AI 的商业化能跳出过去 to B、to G 定制开发的老路。

2022 年初,夏令又见了闫俊杰两次。这之前不久的明势年底总结会上,夏令做了一次未来 5 年的 AI 技术趋势推演,当他把 “多模态技术值得把 Adobe 重做一遍”、Agency、更智能的机器人等想法告诉闫俊杰后,对方放下筷子,分享了 MiniMax 具体想做什么方向的应用。

再下一次见面,正好赶上 2 月 14 日。这次夏令想验证:MiniMax 更看好 to C 还是 to B?“to C。” 闫俊杰说,不会再走定制化 to B 项目的老路,这也是夏令心中所想。讲得投入,两人都没怎么吃菜,这个节日没有鲜花,夏令给家里打包回了一盘鱿鱼花。

与高瓴相似,明势也看重闫俊杰从算法、工程到业务的综合经验。这在投资当年得到验证:2022 年下半年,已经训了几版文本模型的 MiniMax 开始在全国四处寻找 GPU,正好一批自动驾驶公司退场,不少 GPU 算力被退租,MiniMax 以大模型热潮到来后的半价租到了算力。

明势创始合伙人黄明明如此描述闫俊杰创业时的决心:“那时 ChatGPT 还没发布,OpenAI 也不温不火,在商汤已经做到中高层的闫俊杰跳出来要创业。” 明势是投资 MiniMax 轮次最多的机构之一,算上 IPO 的基石轮投资和上市前的 7 轮投资,明势投了 8 轮中的 6 轮。

ChatGPT 来了,一切不一样了

快共识下的投资盛况

2022 年 10 月,MiniMax 发布第一款产品 Glow,没做什么投放,在 2 个月里积累了上百万二次元用户。对一个正式运营不到一年,尝试 AI to C 新路径的创业公司,这本是一个不错的开局。但很快,11 月上线的 ChatGPT 掀起巨浪,Glow 成了一朵小水花。

快共识下,MiniMax 一方面直接受益,它在 2023 年初迅速开启第三轮,总计融到了 2.6 亿美元,是此前两轮融资之和的 3 倍多,投后估值达到 11.57 亿美元。腾讯小米、小红书等战投方,顺为、绿洲等新股东加入,老股东全部继续投资。

另一方面,MiniMax 也不再是市场上仅有的几个选择。百模大战开启,一批各有特点和优势的创业公司涌现:王慧文自投 5000 万美元成立光年之外,做出过搜狗输入法等超级应用的王小川创立百川智能,李开复成立零一万物。新锐技术力量中,有同样更早起步、成立于 2019 年的智谱;开发过 XLNet、Transformer-XL 的杨植麟创立的月之暗面,他的学术背景与大语言模型直接相关。这些公司都迅速获得了融资。一些投资方则同时投资多家公司,如阿里、腾讯和顺为。

MiniMax 的策略是更多保留主动权,不要太快稀释股份。腾讯本想在 MiniMax 的第三轮中投资更多,最终 MiniMax 拿了腾讯 5000 万美元。

字节跳票、红杉入局

2023 年 5 月,王慧文因健康原因结束光年之外,后来影响中国大模型格局的另一个重要角色也做出选择:字节跳动。

字节当时已组建大模型团队,但也考虑对外投资。类似 Google 投资 Anthropic;腾讯、阿里自研和投资双线并进。到 2023 年 6 月前后,字节已给两家大模型公司发出投资意向,MiniMax 和当时组建完不久的阶跃星辰。

但年中的一次高层会后,字节决定不再对外投资大模型公司。张一鸣的态度是:我们为什么不自己做大模型?我们应该自己做,我们也能自己做好。

同期,红杉中国领投 MiniMax A+ 轮,此时高瓴拥有的三轮 Super Pro-rata(优先投资权)已经结束。

这一轮,MiniMax 融资 5000 万美元,投后估值来到 16 亿美元。红杉在此后多轮加持,这也是迄今为止红杉中国在大模型领域投资金额最大的项目之一。IPO 前,红杉中国持有 MiniMax 3.81% 的股份,为第三大财务投资方。红杉也投资了光年之外、月之暗面、阶跃星辰等大模型公司。

据《晚点 LatePost》了解,红杉和高瓴就这一轮中各自份额多少,讨论到了小数点后三位数。

阿里大额出手,那个改变很多人命运的春节

在上一轮 AI 热潮中,阿里既是重要的支持者,也与创业公司有微妙的竞争,恰如此时此刻大厂与 AI 创业公司的关系。

阿里曾同时在商汤和旷视的董事会。2017 年,两家公司都有意收购中国安防领域的老三:宇视,给视觉 AI 找到硬件载体,方法是收购宇视母公司千方科技。但最后,阿里以 37 亿元人民币收购了千方,把宇视纳入囊中,这是为了帮阿里云开拓政企市场。

时过境迁,阿里云逐渐淡出了以私有部署为主的政企业务。大模型热潮后,阿里第 6 号员工吴泳铭在 2023 年回归,担任集团 CEO 和云 CEO,他提出阿里云新战略:AI 驱动,公共云为先。

阿里开始广泛投资大模型公司,这是云上 AI 算力的主要客户。2023 年下半年,阿里陆续投资了智谱、百川智能、零一万物。

到 2023 年底,阿里开始同时接触 MiniMax 和月之暗面。

这是月之暗面后来居上的关键一轮。当时月之暗面原本寻求以 9 亿美元投前估值获得小红书等的投资,而春节前,阿里杀出,投前估值跳涨至 15 亿美元,阿里大手笔投了近 8 亿美元。

早期公司一般会慎重接受如此大额的投资,因为占股太高。但阿里带来的影响力立竿见影:8 亿美元投资迅速成为 AI 行业头条;配合 Kimi 2024 年上半年的产品投放和增长,月之暗面的声量达到了顶点。

阿里最初也想在 MiniMax 占到约 30%~40% 的股比,后来双方谈下来的方案是接受了阿里 4 亿美元的投资。这是 MiniMax 的第 5 轮融资,于 2024 年 3 月交割,总融资额 6.54 亿美元,MiniMax 投后估值达到 25.5 亿美元。同期加入的新股东还有经纬中国和中国人寿等。

上市前,阿里持有 MiniMax 超 13% 的股份,是最大的外部股东。

险资、制造业家办,当更多机构投资大模型

2024 年初阿里对大模型的大额投资后,2024 年到 2025,基础模型领域的融资频率明显降低。字节、阿里等科技巨头加大对 AI 模型和产品的全面投入,有数倍于创业公司的人力、算力,并掌握流量和广告平台。暂时不考虑商业化压力、聚焦模型研发的 DeepSeek,极致、简单、纯粹,把一批需要融资的典型创业公司挤到了聚光灯之外。能继续融到钱的公司少了,能投出大钱的投资方也是。

风险投资之外的更多类型投资方成为 MiniMax 股东,包括中国最早开始做股权投资的险资——国寿投资;李泽楷掌管的盈科拓展;宁德时代联合创始人、副董事长李平单独出资成立的柏睿资本等。他们提供了看待大模型的不一样的视角。

中国人寿:看到了一个让人放心的团队

“岁数不大、决心很大,总是笑眯眯的,讲话也不紧不慢。” 这是顾业池对闫俊杰的第一印象。顾业池是国寿投资保险资产管理公司股权业务负责人,曾在监管部门工作过十年,后来又做了十年股权投资。

中国人寿是险资,不能投错,这比获得超额回报更重要。在陆续见了几乎所有头部大模型公司创始人后,顾业池和中国人寿投资团队选择了 MiniMax,在 2024 年年初和年底连投两轮。

顾业池大概每两个月就会见一次闫俊杰。他认为闫俊杰是一个 “真实、有前瞻性深度思考、笃信技术、一以贯之” 的创始人:“2023 年时,俊杰开始讲 MoE(混合专家系统),接着就训了 MoE,这也是现在行业的主流架构;一年多以前,他和我讲大模型公司应该主要依靠技术而不是投流,他们后来就这么做了,现在这也是行业的主流叙事。”

“这让我们很放心。” 顾业池说。

柏睿资本:想找到能成为企业家的科学家

“如果没有 MiniMax 这个项目,我们不一定会投大模型。” 柏睿资本管理合伙人王利民告诉《晚点 LatePost》。

柏睿资本是宁德时代副董事长李平作为唯一出资人支持的创投机构。李平在 2010 年作为联合创始人创办宁德时代,现任宁德时代副董事长。

ChatGPT 后,原本重点关注先进制造、硬科技的柏睿资本也开始研究大语言模型推动的生成式 AI 革命,他们并不急于出手。

2023 年 11 月,李平和柏睿团队在上海锦江饭店和闫俊杰聊了 3 小时后有了初步投资意向。柏睿后来参与了 2024 年初交割 MiniMax 第四轮融资,这也是柏睿第一次投资软件信息技术。

闫俊杰的成本控制意识,MiniMax 当时对算力的提前布局和成批探索应用、尽早为研发造血的想法,让柏睿感到熟悉。宁德时代在汽车动力电池发展早期也经历了类似过程:靠大巴和商用车业务先形成第一个商业闭环,用这些早期业务的收入投入后续研发,提升电池性能,驱动电池成本陡峭下降。

“闫俊杰很清醒今天的大模型创业的公司、尤其是中国的大模型创业公司,没有那么多钱烧,也没有那么多最先进的算力集群,中国的大模型公司必须走自己的路,在成本和算力受限的条件下发展自己的基础模型。”

“我们从 Robin(曾毓群)身上学到的一点就是,一个顶级的科学家也要顶级的商业思维,才能把企业做好。” 王利民说。

“留在浪潮里”

过去 3 年多,共识快速形成,又被更快推翻:2023 年是追随赛,所有人都锚定 GPT-4;2024 年始于阿里的巨额下注,结束在豆包的后来居上;2025 年,DeepSeek 以极低成本开源了世界一流的推理模型,全球顶尖创业公司的估值来到数千亿美元,谁会成为中国 OpenAI 的问题失去意义。

MiniMax 的生存方式不是极致强化某个长板,而是不断调整脚下,逼近让 AI 服务普通人的方向。

它既做大语言模型,又不放弃多模态生成,因为闫俊杰认为服务普通人的 AI 需要聪明,也需要视觉和语音的多模态交互。做模型、也做应用;闫俊杰曾说 “如果没有产品承接,即使你有技术进展,它最终也不是你的”。做国内市场,也做海外。

星野/Talkie 等陪伴型 AI 应用,生成视频、语音内容的海螺 AI 和 MiniMax 语音,以及开放平台的 API 业务各自给 MiniMax 带来约 3 成的收入,平衡的 1:1:1。

而在闫俊杰直接负责的技术板块,他愿意冒险。2023 年下半年,MiniMax 几乎把全部研发资源投入到做 MoE(混合专家模型)模型,训练失败了两次;2024 年,又把 80% 的资源投入做线性注意力架构的新模型,即后来在 2025 年初发布的 M1,这都是重注他当时看到的上限最高的技术方向。

四处尝试商业化的可能性和力出一孔的技术研发是一体两面。就像 MiniMax 这个名字,在极大的不确定性里,用有限资源寻找极小的成功概率。

2025 年初,闫俊杰说,希望自己一直在浪潮里:“一是能参与推动浪潮继续发生;二是我们能让公司持续发展下去。”

所以,先留在浪潮里。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10