字节、阿里、智谱、MiniMax集体卡位“春节档”,都在赌一场开年爆款

蓝鲸财经
Feb 14

图片来自视觉中国

蓝鲸新闻2月14日讯(记者 武静静)过去一周,AI赛道上,谷歌、DeepSeek、智谱、MiniMax、阿里、字节跳动,几乎在同一时间窗口,密集地投下了它们的新一代模型炸弹。

去年是DeepSeek,今年是谁?AI大模型的“春节档”之战

这不是巧合。一年前的此时,DeepSeek V3的发布意外引爆了全民对AI的认知,开启了中国大模型搅动全球算力格局的叙事。让公众第一次意识到中国模型可能改写全球AI的成本与算力逻辑。那是一场突发的流量事件。

而一年之后,行业已经学会主动制造这样的时刻。Seedance 2.0爆火引发全球关注,把视频模型的能力拉上了新高度,之后字节官宣了新的豆包大模型2.0,谷歌宣布升级Gemini 2.0 Deep Think,DeepSeek开始灰度测试上下文提升10倍的新版本,智谱推出744亿参数的GLM-5,MiniMax拿出号称“为Agent原生设计”的M2.5,阿里的Qwen-Image-2.0发布……

这种密集发布背后,是一个行业共识的变化,也是全年叙事权的起点。“春节这个时间点非常关键。一级市场、二级市场、产业客户,都会在年初重新判断一件事:今年AI会不会继续爆发,谁最有可能跑出来。”一位投资人如是说。

AI开始有了“发布季”,对于大模型公司来说,技术能力不仅要存在,还必须被市场“看到”。春节前后的时间点,既是用户关注度的高峰,也是资本与产业重新定价的关键阶段。

一位美元基金投资人则将这波发布称为“叙事权竞争”。“去年是DeepSeek意外引爆,今年是大家都不想再把舞台让给别人。”他表示,大模型行业已经进入头部博弈阶段,技术差距短期内不会出现代际断层,但市场心智会迅速分层。“去年大家讲的是参数、训练成本、性能。今年大家都在讲Agent、讲工作流、讲生产力,这说明一个信号:资本开始真正关心商业化,而不是技术想象力。”

这一波热潮中Seedance 2.0首当其冲,Seedance 2.0的核心突破不在画质,而在工作流:自动分镜、自运镜、多镜头叙事、原生音画同步,并支持跨场景一致性。它不再只是文生视频工具,而更接近一个具备“导演思维”的创作引擎。海外用户的反馈与话题热度,也反映出一个关键变化:视频生成的可控性,已经跨过了实用门槛。马斯克都在X评论“It's happening fast”,游戏科学创始人冯骥在测试后直言Seedance 2.0为当前“地表最强”的视频生成模型,并称“AIGC的童年时代结束了”。目前,字节跳动称Seedance 2.0全面接入豆包和即梦产品,同时上线火山方舟体验中心,面向用户开放试用。

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节也宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列,在数学和推理能力方面,超越了Gemini 3 Pro在Putnam基准测试上的表现。另外成本方面,其百万tokens输入价格仅为0.6元,相比Gemini 3 Pro和GPT 5.2有较大的成本优势。

近日,阿里也发布了千问最新图像模型Qwen-Image-2.0支持超长文本输入、复杂指令理解,并能够直接生成PPT与信息图,同时具备较强的中文文本渲染能力。其定位已经不再是“生成好看的图片”,而是替代部分设计与内容制作流程。

市场在传阿里的新一代模型Qwen3.5也即将发布。有开发者通过代码与社区信息进一步分析认为,Qwen3.5或将开源至少一个2B规模的密集模型,以及一个35B级别的MoE模型。若相关信息最终落地,意味着阿里在开源生态上的投入力度有望进一步加大。

2026,AI开始回答同一个问题:能创造什么价值?

过去两年,行业的核心问题是:谁的模型更大、谁的基准分数更高。而2026年春节档,各家的发布几乎都在回答同一个问题——模型将如何进入真实生产环境。

谷歌把推理能力做成科研基础设施。升级后的 Gemini 3 Deep Think 被明确定位为“推理模式”,专门面向科学、研究与工程场景,并首次通过 API 向研究人员和企业开放。其在ARC-AGI-2、Codeforces、IMO等基准上的表现达到金牌或顶级水平,更重要的是,谷歌强调其在物理、化学等科学问题中的实际能力。这意味着Deep Think不再只是能力展示,而是瞄准科研与工程场景的高价值用户群体。

DeepSeek 网页/ APP 正在测试新的长文本模型结构,支持 1M 上下文。而API 服务不变,仍为 V3.2,仅支持 128K 上下文。此外,市场也砸期待V4新模型的到来,野村证券于2月10日发布报告称,预计2026年2月中旬推出的DeepSeek V4模型,不会重现去年V3发布时引发的全球AI算力需求恐慌。V4的核心价值在于通过底层架构创新推动AI应用商业化落地。野村进一步指出,V4预计将引入mHC与Engram两项创新技术,从算法与工程层面突破算力芯片与内存瓶颈。

MiniMax和智谱则全面押注Agent。2 月12日,MiniMax 正式上线最新旗舰编程模型 MiniMax M2.5。直接定位为“为Agent场景原生设计的生产级模型”,其编程与智能体性能 (Coding & Agentic) 直接对标 Claude Opus 4.6,M2.5 模型激活参数量仅 10B,在显存占用和推理能效比上优势明显,支持 100 TPS 超高吞吐量,推理速度超国际顶尖模型。发布新模型当日盘中,MiniMax 涨幅一度超过 20%,总市值超 1800 亿港元。

2月11日,智谱推出了新一代旗舰模型GLM-5,GLM-5参数规模扩展至744B,并强化长程Agent任务与复杂系统工程能力,官方称,真实编程环境中的使用体感已逼近Claude Opus 4.5水平。此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为GLM-5。该模型首次引入DeepSeek稀疏注意力机制,在保持长文本处理效果无损的前提下,有效降低部署成本并提升Token利用效率。

这更像是一场“技术路线的公开展演”。各家试图回答的,不再只是“模型更强”,而是如何落地的问题。此时,谁能在开年拿出最惊艳的演示、最清晰的技术路线、最落地的应用场景,谁就能在新一年占得先机。

从能力演进来看,行业正在迈向“任务智能”。无论是视频生成的高可控性、图像模型的办公化能力,还是编程模型面向复杂工程场景的高效执行,各家实际上都在回应同一个核心问题:AI在真实生产流程中究竟能够创造多大价值。下一阶段的竞争,也将从基准成绩与参数规模,转向生产环境中的稳定性、效率与实际反馈——不再是PPT上的领先,而是业务流程中的可用性。

从技术趋势看,底层架构创新正在成为新的分水岭。无论是DeepSeek围绕系统效率的优化,还是MiniMax以10B激活参数实现高性能与高吞吐,背后都指向同一方向:通过算法与架构层面的创新,突破算力与内存的物理约束。模型能力的提升,正逐步从“堆GPU”转向“提效率”。随着推理成本持续下降,应用层的商业探索空间也将随之打开。与此同时,Agent能力开始从概念层走向执行层。模型不仅能够理解任务,还需要具备拆解复杂目标、持续规划并自主完成的能力。在这一过程中,长上下文、高吞吐、低延迟等工程指标,正在成为决定实际可用性的关键参数。

在多模态方向上,能力同样呈现出明显的工作流化趋势。Seedance 2.0支持多镜头叙事与自动分镜,使视频模型开始具备类似“导演思维”的创作能力;Qwen-Image-2.0则能够根据复杂指令直接生成PPT与信息图,图像模型开始理解结构化办公需求。多模态能力正从单点生成工具,向完整生产流程延伸,逐步具备工业化属性。

如果说去年春节前后,DeepSeek的出圈带有一定偶然性,并意外引爆了市场关注,那么一年之后,行业已经明显进入主动节奏。头部厂商不再等待“爆款时刻”,而是通过集中发布建立阶段性预期与市场认知。

2026年的这场春节档,或许只是一个开始。接下来,谁能持续拿出真正进入生产环境的能力,才是决定这一轮竞争格局的关键。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10