字節、阿里、智譜、MiniMax集體卡位「春節檔」,都在賭一場開年爆款

藍鯨財經
02/14

圖片來自視覺中國

藍鯨新聞2月14日訊(記者 武靜靜)過去一周,AI賽道上,谷歌、DeepSeek、智譜、MiniMax、阿里、字節跳動,幾乎在同一時間窗口,密集地投下了它們的新一代模型炸彈。

去年是DeepSeek,今年是誰?AI大模型的「春節檔」之戰

這不是巧合。一年前的此時,DeepSeek V3的發布意外引爆了全民對AI的認知,開啓了中國大模型攪動全球算力格局的敘事。讓公衆第一次意識到中國模型可能改寫全球AI的成本與算力邏輯。那是一場突發的流量事件。

而一年之後,行業已經學會主動製造這樣的時刻。Seedance 2.0爆火引發全球關注,把視頻模型的能力拉上了新高度,之後字節官宣了新的豆包大模型2.0,谷歌宣佈升級Gemini 2.0 Deep Think,DeepSeek開始灰度測試上下文提升10倍的新版本,智譜推出744億參數的GLM-5,MiniMax拿出號稱「為Agent原生設計」的M2.5,阿里的Qwen-Image-2.0發布……

這種密集發布背後,是一個行業共識的變化,也是全年敘事權的起點。「春節這個時間點非常關鍵。一級市場、二級市場、產業客戶,都會在年初重新判斷一件事:今年AI會不會繼續爆發,誰最有可能跑出來。」一位投資人如是說。

AI開始有了「發布季」,對於大模型公司來說,技術能力不僅要存在,還必須被市場「看到」。春節前後的時間點,既是用戶關注度的高峯,也是資本與產業重新定價的關鍵階段。

一位美元基金投資人則將這波發布稱為「敘事權競爭」。「去年是DeepSeek意外引爆,今年是大家都不想再把舞台讓給別人。」他表示,大模型行業已經進入頭部博弈階段,技術差距短期內不會出現代際斷層,但市場心智會迅速分層。「去年大家講的是參數、訓練成本、性能。今年大家都在講Agent、講工作流、講生產力,這說明一個信號:資本開始真正關心商業化,而不是技術想象力。」

這一波熱潮中Seedance 2.0首當其衝,Seedance 2.0的核心突破不在畫質,而在工作流:自動分鏡、自運鏡、多鏡頭敘事、原生音畫同步,並支持跨場景一致性。它不再只是文生視頻工具,而更接近一個具備「導演思維」的創作引擎。海外用戶的反饋與話題熱度,也反映出一個關鍵變化:視頻生成的可控性,已經跨過了實用門檻。馬斯克都在X評論「It's happening fast」,遊戲科學創始人馮驥在測試後直言Seedance 2.0為當前「地表最強」的視頻生成模型,並稱「AIGC的童年時代結束了」。目前,字節跳動稱Seedance 2.0全面接入豆包和即夢產品,同時上線火山方舟體驗中心,面向用戶開放試用。

在連續發布Seedance 2.0視頻模型、Seedream 5.0 Lite圖像模型之後,2月14日,字節也宣佈推出豆包大模型2.0(Doubao-Seed-2.0)系列,在數學和推理能力方面,超越了Gemini 3 Pro在Putnam基準測試上的表現。另外成本方面,其百萬tokens輸入價格僅為0.6元,相比Gemini 3 Pro和GPT 5.2有較大的成本優勢。

近日,阿里也發布了千問最新圖像模型Qwen-Image-2.0支持超長文本輸入、複雜指令理解,並能夠直接生成PPT與信息圖,同時具備較強的中文文本渲染能力。其定位已經不再是「生成好看的圖片」,而是替代部分設計與內容製作流程。

市場在傳阿里的新一代模型Qwen3.5也即將發布。有開發者通過代碼與社區信息進一步分析認為,Qwen3.5或將開源至少一個2B規模的密集模型,以及一個35B級別的MoE模型。若相關信息最終落地,意味着阿里在開源生態上的投入力度有望進一步加大。

2026,AI開始回答同一個問題:能創造什麼價值?

過去兩年,行業的核心問題是:誰的模型更大、誰的基準分數更高。而2026年春節檔,各家的發布幾乎都在回答同一個問題——模型將如何進入真實生產環境。

谷歌把推理能力做成科研基礎設施。升級後的 Gemini 3 Deep Think 被明確定位為「推理模式」,專門面向科學、研究與工程場景,並首次通過 API 向研究人員和企業開放。其在ARC-AGI-2、Codeforces、IMO等基準上的表現達到金牌或頂級水平,更重要的是,谷歌強調其在物理、化學等科學問題中的實際能力。這意味着Deep Think不再只是能力展示,而是瞄準科研與工程場景的高價值用戶羣體。

DeepSeek 網頁/ APP 正在測試新的長文本模型結構,支持 1M 上下文。而API 服務不變,仍為 V3.2,僅支持 128K 上下文。此外,市場也砸期待V4新模型的到來,野村證券於2月10日發布報告稱,預計2026年2月中旬推出的DeepSeek V4模型,不會重現去年V3發布時引發的全球AI算力需求恐慌。V4的核心價值在於通過底層架構創新推動AI應用商業化落地。野村進一步指出,V4預計將引入mHC與Engram兩項創新技術,從算法與工程層面突破算力芯片與內存瓶頸。

MiniMax和智譜則全面押注Agent。2 月12日,MiniMax 正式上線最新旗艦編程模型 MiniMax M2.5。直接定位為「為Agent場景原生設計的生產級模型」,其編程與智能體性能 (Coding & Agentic) 直接對標 Claude Opus 4.6,M2.5 模型激活參數量僅 10B,在顯存佔用和推理能效比上優勢明顯,支持 100 TPS 超高吞吐量,推理速度超國際頂尖模型。發布新模型當日盤中,MiniMax 漲幅一度超過 20%,總市值超 1800 億港元。

2月11日,智譜推出了新一代旗艦模型GLM-5,GLM-5參數規模擴展至744B,並強化長程Agent任務與複雜系統工程能力,官方稱,真實編程環境中的使用體感已逼近Claude Opus 4.5水平。此前在全球模型服務平台OpenRouter登頂熱度榜首的神祕模型「Pony Alpha」即為GLM-5。該模型首次引入DeepSeek稀疏注意力機制,在保持長文本處理效果無損的前提下,有效降低部署成本並提升Token利用效率。

這更像是一場「技術路線的公開展演」。各家試圖回答的,不再只是「模型更強」,而是如何落地的問題。此時,誰能在開年拿出最驚豔的演示、最清晰的技術路線、最落地的應用場景,誰就能在新一年佔得先機。

從能力演進來看,行業正在邁向「任務智能」。無論是視頻生成的高可控性、圖像模型的辦公化能力,還是編程模型面向複雜工程場景的高效執行,各家實際上都在回應同一個核心問題:AI在真實生產流程中究竟能夠創造多大價值。下一階段的競爭,也將從基準成績與參數規模,轉向生產環境中的穩定性、效率與實際反饋——不再是PPT上的領先,而是業務流程中的可用性。

從技術趨勢看,底層架構創新正在成為新的分水嶺。無論是DeepSeek圍繞系統效率的優化,還是MiniMax以10B激活參數實現高性能與高吞吐,背後都指向同一方向:通過算法與架構層面的創新,突破算力與內存的物理約束。模型能力的提升,正逐步從「堆GPU」轉向「提效率」。隨着推理成本持續下降,應用層的商業探索空間也將隨之打開。與此同時,Agent能力開始從概念層走向執行層。模型不僅能夠理解任務,還需要具備拆解複雜目標、持續規劃並自主完成的能力。在這一過程中,長上下文、高吞吐、低延遲等工程指標,正在成為決定實際可用性的關鍵參數。

在多模態方向上,能力同樣呈現出明顯的工作流化趨勢。Seedance 2.0支持多鏡頭敘事與自動分鏡,使視頻模型開始具備類似「導演思維」的創作能力;Qwen-Image-2.0則能夠根據複雜指令直接生成PPT與信息圖,圖像模型開始理解結構化辦公需求。多模態能力正從單點生成工具,向完整生產流程延伸,逐步具備工業化屬性。

如果說去年春節前後,DeepSeek的出圈帶有一定偶然性,並意外引爆了市場關注,那麼一年之後,行業已經明顯進入主動節奏。頭部廠商不再等待「爆款時刻」,而是通過集中發布建立階段性預期與市場認知。

2026年的這場春節檔,或許只是一個開始。接下來,誰能持續拿出真正進入生產環境的能力,纔是決定這一輪競爭格局的關鍵。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10