2025AI中场战事：谁在撤退，谁在进攻？

作者/新摘商业评论南一

目前，国内AI大模型市场由“百模大战”逐渐进入淘汰整合的中场阶段。

历经2023年以来的“百模大战”和资本狂热，行业格局正逐步清晰。曾经百家争鸣的局面已经洗牌，今天的舞台由新老巨头与新晋独角兽两大阵营主导。

在头部技术路线和商业化落地上，老牌互联网巨头和“新BAT”——以百度、字节跳动、阿里、腾讯、为代表，抢占先机；同时涌现出的“基模五强”——字节跳动、阿里、阶跃星辰、智谱AI、DeepSeek等也在全线发起进攻。

这些巨头与独角兽们在模型创新、算力投入、生态布局、开源策略等方面各有打法。与此同时，“AI六小龙”的处境却出现分化，有的已开始收缩阵脚。

距离ChatGPT发布仅过了2年，从巅峰时期的300家大模型同台竞技到洗牌至以月之暗面、MiniMax、智谱、阶跃星辰、零一万物、百川智能为代表的“大模型六小龙”。他们曾雄心勃勃追赶OpenAI的脚步。

然而当前，随着巨头势力全面加持，技术门槛和成本壁垒不断攀升，“小龙们”的生存空间正在被挤压。同样重要的是，新一轮AI攻势还催生了一批规模巨大的玩家。

字节跳动、阿里为代表的巨型互联网公司纷纷在大模型领域加大投入，各自布局了大型AI中台和应用生态。和他们并肩作战的，还有新崛起的阶跃星辰、智谱AI、DeepSeek等明星级创业团队。这些“新基模五强”为主的玩家各显神通，掀起了又一轮技术与市场竞争。如今战线已从前沿算法逐步向商业化与生态落地转移，价格战与应用场景争夺成为新的焦点。

一、高筑墙，广积粮，新老BAT凶猛

在这场AI博弈中，巨头阵营的攻势格外凶猛。

字节跳动在这一轮洗牌中保持了稳扎稳打的进攻态势，近年推出的“大模型家族”，如豆包系列模型，在多模态理解与生成上持续升级。最新的豆包通用模型（Doubao-Pro）在公开评测中已与GPT-4系列看齐。字节还针对不同应用场景不断优化模型结构，今年公布的视觉理解模型和种子级文本、语音、音乐等专用模型，使其在语言、视觉、声音等多模态任务上都保持行业领先。

更重要的是，字节对AI商业化投入巨大，豆包系列在公司内部50多个业务场景中大规模上线，日调用量已突破4万亿tokens，7个月增长33倍之多。

不仅如此，为了抢占市场，字节还大胆降价，力推“厘时代”。2024年5月，豆包通用模型首度对外发布时定价仅0.0008元/千token，比行业均价低99.3%；年底再推视觉理解模型，价格仅0.003元/千token，比行业价低85%。这一轮降价风暴在火山引擎AI大会上一举打响，字节相关负责人透露：“5月豆包日调用量1200亿，此前已飙升到4万亿”。

同时，跌价带来的正向循环迅速显现，底层算法实力加上亿级用户生态（抖音、头条、飞书等），使豆包迅速形成覆盖千行百业的闭环。

字节还通过开放开发平台“扣子”集聚开发者，目前已有百万活跃开发者参与构建了200万智能体，全面铺开AI应用生态。综合技术实力、资金、生态三者，字节已成为AI赛道的领跑者之一，其打法可总结为“更强模型+更低价格+更易落地”。

阿里作为开源最早、最完整的大公司，在AI的投入上也最坚决。

截至目前，通义团队累积开源200多款模型，涵盖了千问（Qwen）大语言模型和万相（Wan）视觉生成模型两大基座系列。在4月底，阿里发布的最新“千问家族”Qwen3 系列模型，包含 0.6B 至 235B 规模的多款模型（包括两款 Mixture-of-Experts 大模型），并选择将模型完全开源。在性能方面，Qwen3 小模型（4B 参数）可以达到上一代 Qwen2 大模型的效果，而 Qwen-3 系列整体在多模态和推理上有显著提升。整体布局，正如马云所言，“AI 不是选择题，而是阿里的必答题”。

配合新模型，阿里还在云服务端积极降价抢市场，2024 年，阿里已将多款大模型推理价格砍至原价的3% 左右，并在 2025 年继续降价。阿里通过开放模式与巨额补贴双管齐下，一方面开放底层模型以吸引全球开发者关注，另一方面下调成本激发生态活力，反映了持续投入的决心。

腾讯在大模型领域的战略和部署同样持续进化。

4月份，腾讯对其混元大模型研发体系进行了全面重构，围绕算力、算法和数据三大核心板块，刷新团队部署，加码研发投入。调整后，腾讯成立两个新的部门：大语言模型部和多模态模型部，分别负责探索大语言模型和多模态大模型的前沿技术，持续迭代基础模型，提升模型能力。腾讯官方人士表示，此举旨在优化研发流程、整合资源，以应对大模型时代日新月异的挑战。

此前，腾讯已经将元宝、ima、QQ浏览器、搜狗输入法等几大AI产品线整合，提出“核心自研+拥抱开源”的AI策略。具体来看，腾讯自研的混元模型多模态性能强劲。今年推出的“快思考”Turbo S模型和“深度思考”T1模型，在公开基准上均达业界领先水平；在视觉、3D生成领域，腾讯也开源了多款模型（如混元3D生成、混元视频生成、文生图DiT、千亿参数混元MoE模型等），这些模型在GitHub上收获了近3万星标。混元模型已深度嵌入微信、QQ、腾讯会议、腾讯文档等产品，提高了用户端的智能化体验，同时通过腾讯云向外输出能力，助力合作伙伴创新提效。

值得注意的是，据腾讯2024年四季度及年度财报显示，腾讯研发投入再次创下历史新高，达到707亿元，这为其大模型技术攻关提供了雄厚后盾。在持续的中场博弈中，腾讯凭借底层算法实力、开源影响力和全域生态的输出，构筑了独特的防线和进攻点。

同样，作为老牌互联网巨头，百度在2025年上半年持续加码大模型研发与开源，以“文心大模型”4.5系列为核心，先后推出并免费开放 ERNIE 4.5 和深度思考 X1，其性能在多模态理解和推理能力上已全面超越同级竞品，且通过 Turbo 版本将推理成本分别降低至 0.8 元和 1 元/百万 Token。

市场应用层面，文心一言平台自4月全面免费后，用户规模迅速攀升至 4.3 亿，日均调用量突破 15 亿次。未来 ERNIE 5.0 的推出，预计在多模态融合与推理效率上进一步革新。

在产品与生态层面，百度已将大模型能力深植搜索与智能助手，先后上线“AI搜”智能检索服务和通用智能体 App“心响”，覆盖知识问答、文档处理、旅游规划等百余场景，并通过开放 API 吸引开发者创新。

二、新锐突围，基础大模型格局再洗牌

除了“新老BAT”外，一些大模型初创企业同样展开全面进攻。

上海独角兽阶跃星辰作为新兴力量，今年来动作频频。2024年末该公司完成B轮融资数亿美元，由上海国资领投、腾讯等战略投资者跟投。官方披露，融资将继续用于核心大模型的研发，特别是强化多模态和复杂推理能力，并通过产品生态进一步渗透C端市场。

今年2月，阶跃星辰开源发布了其性能最强的两款多模态模型：其中“Step-Video-T2V”拥有300亿参数，能生成204帧、540P高质量视频；“Step-Audio”在多项公开语音评测中超越业内同类开源模型，尤其在汉语六级水平考试中表现突出。

据了解，成立不到两年、团队500余人的阶跃星辰，在迭代了11个模型后跻身“AI六小虎”行列，并被《麻省理工科技评论》评为“中国值得关注的四家AI创业公司之一”。公司高管透露，团队中算法和技术人员占比接近八成，创始人姜大昕为微软前高管、IEEE Fellow入选者，首席科学家张祥雨则为ResNet论文合著者。这些“高密度人才”正支撑阶跃星辰在多模态技术上的狂飙突进。

与此同时，来自清华学府的智谱AI也高速扩张，并已启动上市进程。今年4月，智谱AI正式在证监局备案辅导（中金公司为辅导机构），标志着其成为国内首家进入IPO流程的大模型创业公司。

智谱AI自2019年成立以来，一直专注认知智能大模型研发。该公司与学术机构合作打造了中英双语千亿参数预训练模型GLM-130B，并基于此推出了对话模型ChatGLM及其开源版本ChatGLM-6B。

除通用模型外，智谱还推出了多模态和行业应用组件：包括AI助手“智谱清言”、高效代码生成模型CodeGeeX、视觉语言理解模型CogVLM、文生图模型CogView等。商业模式上，智谱主张“模型即服务（MaaS）”，已建成AI开发开放平台，为政府和企业提供私有化部署和智能体解决方案。

据官方介绍，其MaaS平台已支持百万量级开发者，与全球多家车厂、终端厂商合作，将大模型从“聊”引向“行”。凭借深厚学术背景与产业合作，智谱AI正力图成为“基座模型”领域的领军企业。

在这阵营中，DeepSeek的声音当然也不容忽视。DeepSeek团队非常低调，但技术打法极具冲击力。他们专注于语言模型、尤其是数理逻辑能力，并秉持坚定的开源策略。今年农历春节期间发布的DeepSeek-R1模型，以远低于常规的算力投入，实现了与GPT-4等顶级模型媲美的性能。

业内分析认为，DeepSeek在训练方法上的创新才是关键：其采用的Mixture-of-Experts架构使模型参数总量达6710亿，但运行时只激活37亿参数，大幅降低计算需求；多Token预测和“潜注意力”等技术也极大提升了效率。

简言之，DeepSeek走的是偏科研的路线，不急于变现，团队以顶尖新秀为主、规模精简，将更多资源投入算法优化。正因如此，一度被忽视的DeepSeek一经开源便引爆关注，据报道，其App已突破3000万日活，成史上最快登顶的AI应用之一。投资者与同行也纷纷围拢，例如新浪财经报道，“DeepSeek-R1开源后，众多业内人士重新审视DeepSeek的技术实力，私募纷纷尝试接触其创始人梁文锋”。DeepSeek通过极致的工程优化与开源创新，已悄然建立起自己的竞争优势。

总体来看，以字节跳动、阿里巴巴、腾讯为代表的新BAT，以及阶跃星辰、智谱AI、DeepSeek等新兴主力，构成了当前中国AI“大模型”赛道的进攻重兵。他们在技术研发、人才储备、资金投入和市场开拓上全面发力，推动着AI技术不断向世界前沿靠近。在这种格局下，大公司的优势在于资源与生态整合，而创业公司则更强调创新与专注，各有千秋。

三、退守与聚焦，AI六小龙瓦解

相比之下，“AI六小龙”——曾被寄予厚望的创业小企业，则出现了明显分化。

以李开复创办的零一万物为例，2025年伊始便曝出要将预训练团队出售给阿里的传闻。尽管李开复辟谣称并非出售，但他已承认“目前只有大厂能持续投入超大规模模型训练”。公司大幅调整方向，主动与阿里云合作成立“产业大模型联合实验室”，将预训练算法团队和基础设施团队交给阿里，专心做小参数高性价比模型。他坦言：“我们不再做超大模型，不是因为不相信 Scaling Law，而是把这件事交给能做的大公司来做，我们跟他们合作，这才是生存之道”。

零一万物开始放弃自行训练万亿参数模型，转向针对电商直播、会议等场景的行业智能应用，推出 AI 数字人和“Yi”系列服务。虽未立刻倒闭，但其已清晰地从“造基座”往后撤步，调整为聚焦落地应用。

同样，百川智能也显示出战略调整迹象。2024 年 7 月宣布完成 50 亿元人民币 A 轮融资，估值约 200 亿元，投资方包括阿里、腾讯、小米等互联网巨头。百川主打医疗方向，大模型“百川-53B”于 2023 年底问世，AI 助手“百小应”上线，曾在 2024 年 WAIC 展台展示医疗问诊应用。

而今年3 月中旬就有媒体爆出，百川两位联合创始人已经确认离职。股权回购与融资并购也传出争议。此外，王小川在内部信中提到了成立两年来百川智能的不足，称公司“两年来战线拉得太长、不够聚焦”，公司前后已经裁撤部分 ToB 金融部门，将重心回归医疗专家模型和百小应产品。可见百川虽依然获得资金支撑，维持产品更新和生态拓展，但内部正在精简业务以求聚焦。

月之暗面近期明显收紧打法，缩减烧钱战略。春节后有媒体披露，在DeepSeek攻势之下，月之暗面决定大幅压缩市场推广预算，暂停多款安卓渠道投放并解除第三方广告合作。公司内部将此归因于“外部环境变化和战略调整”，表明其营销打法将更加谨慎。

此前，月之暗面曾以广撒网的方式重点推广AI助手Kimi，也在海外推出Ohai、Noisee等产品。但根据晚点财经报道，月之暗面今年9月已决定停止Ohai和Noisee的运营，将资源集中在核心产品Kimi。有两位负责海外产品的高管离职创业，创办了定位于AI编程的公司。这些动向与资本市场的谨慎形成对照，不难看出，这家曾估值近25亿美元的独角兽在战术上更加聚焦，降低了非核心业务拓展的投入。

而MiniMax的路径选择就显得既谨慎又富有张力。这家曾因创始团队出身商汤而备受瞩目的公司，早期凭借Talkie这类情感陪伴类应用快速打开海外市场，日交互量一度突破30亿次，但如今却面临用户增长乏力、留存率下滑的困境。当赛道瓶颈逐渐显现，MiniMax继而调整策略，逐渐淡出同质化严重的情感陪聊红海，转而将资源向视频生成、音乐创作等更具技术壁垒的领域倾斜。

MiniMax作为国内首个自主研发MoE混合专家架构的团队，他们早已不满足于单一模态的较量，而是构建起覆盖文本、语音、图像、视频的全矩阵模型体系。

产品布局上，MiniMax采取To B与To C双线并进的策略。To B端通过开放平台接入3万家企业，覆盖客服、教育等标准化场景以降低边际成本；To C端则依靠星野、Talkie等情感陪伴应用积累日均30亿次交互数据，但面临用户增长放缓、付费能力有限及海外监管风险。近期推出的海螺AI试图以文生视频、音乐生成等特色功能突破同质化竞争，但渗透率仍需提升。

今年3月，MiniMax虽获6亿美元A + 轮融资，旗下Talkie应用日交互量超30亿次，却仍未找到稳定盈利模式。尽管有大量资金注入且产品有一定用户活跃度，但MiniMax在盈利模式上尚未取得突破，目前仍在不断尝试和调整，以在竞争激烈的市场中找到可持续发展的道路。

总的来看，AI创业“小龙们”的走势已有显著差异，但是，这种趋势并非败退，而是行业成熟期必然的理性回调，最终目标是在巨头夹缝中守住“小而美”的生存空间。

相反，以字节、阿里、腾讯为首的重量级玩家由于资金、人才、生态和数据积累优势，正处于中场竞赛的主动位置。未来谁能在“智能上限”和“多模态能力”上取得突破，还有待考验。

但可以肯定的是，这场“中场战事”已经由此前的狂飙突进转向稳扎稳打的比拼，各路玩家都在砥砺技术、优化策略，一方面力图保留优势，一方面寻求新的成长路径。要知道，“大模型的路要跑得清楚，最终还得落到产品上”，谁能走得更久、更稳，将决定这场AI竞赛的下一阶段格局。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Tiger Brokers

2025AI中场战事：谁在撤退，谁在进攻？

Most Discussed