作者/新摘商業評論 南一
目前,國內AI大模型市場由「百模大戰」逐漸進入淘汰整合的中場階段。
歷經2023年以來的「百模大戰」和資本狂熱,行業格局正逐步清晰。曾經百家爭鳴的局面已經洗牌,今天的舞台由新老巨頭與新晉獨角獸兩大陣營主導。
在頭部技術路線和商業化落地上,老牌互聯網巨頭和「新BAT」——以百度、字節跳動、阿里、騰訊、為代表,搶佔先機;同時湧現出的「基模五強」——字節跳動、阿里、階躍星辰、智譜AI、DeepSeek等也在全線發起進攻。
這些巨頭與獨角獸們在模型創新、算力投入、生態佈局、開源策略等方面各有打法。與此同時,「AI六小龍」的處境卻出現分化,有的已開始收縮陣腳。
距離ChatGPT發布僅過了2年,從巔峯時期的300家大模型同台競技到洗牌至以月之暗面、MiniMax、智譜、階躍星辰、零一萬物、百川智能為代表的「大模型六小龍」。他們曾雄心勃勃追趕OpenAI的腳步。
然而當前,隨着巨頭勢力全面加持,技術門檻和成本壁壘不斷攀升,「小龍們」的生存空間正在被擠壓。同樣重要的是,新一輪AI攻勢還催生了一批規模巨大的玩家。
字節跳動、阿里為代表的巨型互聯網公司紛紛在大模型領域加大投入,各自佈局了大型AI中台和應用生態。和他們並肩作戰的,還有新崛起的階躍星辰、智譜AI、DeepSeek等明星級創業團隊。這些「新基模五強」為主的玩家各顯神通,掀起了又一輪技術與市場競爭。如今戰線已從前沿算法逐步向商業化與生態落地轉移,價格戰與應用場景爭奪成為新的焦點。
一、高築牆,廣積糧,新老BAT兇猛
在這場AI博弈中,巨頭陣營的攻勢格外兇猛。
字節跳動在這一輪洗牌中保持了穩紮穩打的進攻態勢,近年推出的「大模型家族」,如豆包系列模型,在多模態理解與生成上持續升級。最新的豆包通用模型(Doubao-Pro)在公開評測中已與GPT-4系列看齊。字節還針對不同應用場景不斷優化模型結構,今年公布的視覺理解模型和種子級文本、語音、音樂等專用模型,使其在語言、視覺、聲音等多模態任務上都保持行業領先。
更重要的是,字節對AI商業化投入巨大,豆包系列在公司內部50多個業務場景中大規模上線,日調用量已突破4萬億tokens,7個月增長33倍之多。
不僅如此,為了搶佔市場,字節還大膽降價,力推「釐時代」。2024年5月,豆包通用模型首度對外發布時定價僅0.0008元/千token,比行業均價低99.3%;年底再推視覺理解模型,價格僅0.003元/千token,比行業價低85%。這一輪降價風暴在火山引擎AI大會上一舉打響,字節相關負責人透露:「5月豆包日調用量1200億,此前已飆升到4萬億」。
同時,跌價帶來的正向循環迅速顯現,底層算法實力加上億級用戶生態(抖音、頭條、飛書等),使豆包迅速形成覆蓋千行百業的閉環。
字節還通過開放開發平台「釦子」集聚開發者,目前已有百萬活躍開發者參與構建了200萬智能體,全面鋪開AI應用生態。綜合技術實力、資金、生態三者,字節已成為AI賽道的領跑者之一,其打法可總結為「更強模型+更低價格+更易落地」。
阿里作為開源最早、最完整的大公司,在AI的投入上也最堅決。
截至目前,通義團隊累積開源200多款模型,涵蓋了千問(Qwen)大語言模型和萬相(Wan)視覺生成模型兩大基座系列。在4月底,阿里發布的最新「千問家族」Qwen3 系列模型,包含 0.6B 至 235B 規模的多款模型(包括兩款 Mixture-of-Experts 大模型),並選擇將模型完全開源。在性能方面,Qwen3 小模型(4B 參數)可以達到上一代 Qwen2 大模型的效果,而 Qwen-3 系列整體在多模態和推理上有顯著提升。整體佈局,正如馬雲所言,「AI 不是選擇題,而是阿里的必答題」。
配合新模型,阿里還在雲服務端積極降價搶市場,2024 年,阿里已將多款大模型推理價格砍至原價的3% 左右,並在 2025 年繼續降價。阿里通過開放模式與鉅額補貼雙管齊下,一方面開放底層模型以吸引全球開發者關注,另一方面下調成本激發生態活力,反映了持續投入的決心。
騰訊在大模型領域的戰略和部署同樣持續進化。
4月份,騰訊對其混元大模型研發體系進行了全面重構,圍繞算力、算法和數據三大核心板塊,刷新團隊部署,加碼研發投入。調整後,騰訊成立兩個新的部門:大語言模型部和多模態模型部,分別負責探索大語言模型和多模態大模型的前沿技術,持續迭代基礎模型,提升模型能力。騰訊官方人士表示,此舉旨在優化研發流程、整合資源,以應對大模型時代日新月異的挑戰。
此前,騰訊已經將元寶、ima、QQ瀏覽器、搜狗輸入法等幾大AI產品線整合,提出「核心自研+擁抱開源」的AI策略。具體來看,騰訊自研的混元模型多模態性能強勁。今年推出的「快思考」Turbo S模型和「深度思考」T1模型,在公開基準上均達業界領先水平;在視覺、3D生成領域,騰訊也開源了多款模型(如混元3D生成、混元視頻生成、文生圖DiT、千億參數混元MoE模型等),這些模型在GitHub上收穫了近3萬星標。混元模型已深度嵌入微信、QQ、騰訊會議、騰訊文檔等產品,提高了用戶端的智能化體驗,同時通過騰訊雲向外輸出能力,助力合作伙伴創新提效。
值得注意的是,據騰訊2024年四季度及年度財報顯示,騰訊研發投入再次創下歷史新高,達到707億元,這為其大模型技術攻關提供了雄厚後盾。在持續的中場博弈中,騰訊憑藉底層算法實力、開源影響力和全域生態的輸出,構築了獨特的防線和進攻點。
同樣,作為老牌互聯網巨頭,百度在2025年上半年持續加碼大模型研發與開源,以「文心大模型」4.5系列為核心,先後推出並免費開放 ERNIE 4.5 和深度思考 X1,其性能在多模態理解和推理能力上已全面超越同級競品,且通過 Turbo 版本將推理成本分別降低至 0.8 元和 1 元/百萬 Token。
市場應用層面,文心一言平台自4月全面免費後,用戶規模迅速攀升至 4.3 億,日均調用量突破 15 億次。未來 ERNIE 5.0 的推出,預計在多模態融合與推理效率上進一步革新。
在產品與生態層面,百度已將大模型能力深植搜索與智能助手,先後上線「AI搜」智能檢索服務和通用智能體 App「心響」,覆蓋知識問答、文檔處理、旅遊規劃等百餘場景,並通過開放 API 吸引開發者創新。
二、新銳突圍,基礎大模型格局再洗牌
除了「新老BAT」外,一些大模型初創企業同樣展開全面進攻。
上海獨角獸階躍星辰作為新興力量,今年來動作頻頻。2024年末該公司完成B輪孖展數億美元,由上海國資領投、騰訊等戰略投資者跟投。官方披露,孖展將繼續用於核心大模型的研發,特別是強化多模態和複雜推理能力,並通過產品生態進一步滲透C端市場。
今年2月,階躍星辰開源發布了其性能最強的兩款多模態模型:其中「Step-Video-T2V」擁有300億參數,能生成204幀、540P高質量視頻;「Step-Audio」在多項公開語音評測中超越業內同類開源模型,尤其在漢語六級水平考試中表現突出。
據了解,成立不到兩年、團隊500餘人的階躍星辰,在迭代了11個模型後躋身「AI六小虎」行列,並被《麻省理工科技評論》評為「中國值得關注的四家AI創業公司之一」。公司高管透露,團隊中算法和技術人員佔比接近八成,創始人姜大昕為微軟前高管、IEEE Fellow入選者,首席科學家張祥雨則為ResNet論文合著者。這些「高密度人才」正支撐階躍星辰在多模態技術上的狂飆突進。
與此同時,來自清華學府的智譜AI也高速擴張,並已啓動上市進程。今年4月,智譜AI正式在證監局備案輔導(中金公司為輔導機構),標誌着其成為國內首家進入IPO流程的大模型創業公司。
智譜AI自2019年成立以來,一直專注認知智能大模型研發。該公司與學術機構合作打造了中英雙語千億參數預訓練模型GLM-130B,並基於此推出了對話模型ChatGLM及其開源版本ChatGLM-6B。
除通用模型外,智譜還推出了多模態和行業應用組件:包括AI助手「智譜清言」、高效代碼生成模型CodeGeeX、視覺語言理解模型CogVLM、文生圖模型CogView等。商業模式上,智譜主張「模型即服務(MaaS)」,已建成AI開發開放平台,為政府和企業提供私有化部署和智能體解決方案。
據官方介紹,其MaaS平台已支持百萬量級開發者,與全球多家車廠、終端廠商合作,將大模型從「聊」引向「行」。憑藉深厚學術背景與產業合作,智譜AI正力圖成為「基座模型」領域的領軍企業。
在這陣營中,DeepSeek的聲音當然也不容忽視。DeepSeek團隊非常低調,但技術打法極具衝擊力。他們專注於語言模型、尤其是數理邏輯能力,並秉持堅定的開源策略。今年農曆春節期間發布的DeepSeek-R1模型,以遠低於常規的算力投入,實現了與GPT-4等頂級模型媲美的性能。
業內分析認為,DeepSeek在訓練方法上的創新纔是關鍵:其採用的Mixture-of-Experts架構使模型參數總量達6710億,但運行時只激活37億參數,大幅降低計算需求;多Token預測和「潛注意力」等技術也極大提升了效率。
簡言之,DeepSeek走的是偏科研的路線,不急於變現,團隊以頂尖新秀為主、規模精簡,將更多資源投入算法優化。正因如此,一度被忽視的DeepSeek一經開源便引爆關注,據報道,其App已突破3000萬日活,成史上最快登頂的AI應用之一。投資者與同行也紛紛圍攏,例如新浪財經報道,「DeepSeek-R1開源後,衆多業內人士重新審視DeepSeek的技術實力,私募紛紛嘗試接觸其創始人梁文鋒」。DeepSeek通過極致的工程優化與開源創新,已悄然建立起自己的競爭優勢。
總體來看,以字節跳動、阿里巴巴、騰訊為代表的新BAT,以及階躍星辰、智譜AI、DeepSeek等新興主力,構成了當前中國AI「大模型」賽道的進攻重兵。他們在技術研發、人才儲備、資金投入和市場開拓上全面發力,推動着AI技術不斷向世界前沿靠近。在這種格局下,大公司的優勢在於資源與生態整合,而創業公司則更強調創新與專注,各有千秋。
三、退守與聚焦,AI六小龍瓦解
相比之下,「AI六小龍」——曾被寄予厚望的創業小企業,則出現了明顯分化。
以李開復創辦的零一萬物為例,2025年伊始便曝出要將預訓練團隊出售給阿里的傳聞。儘管李開復闢謠稱並非出售,但他已承認「目前只有大廠能持續投入超大規模模型訓練」。公司大幅調整方向,主動與阿里雲合作成立「產業大模型聯合實驗室」,將預訓練算法團隊和基礎設施團隊交給阿里,專心做小參數高性價比模型。他坦言:「我們不再做超大模型,不是因為不相信 Scaling Law,而是把這件事交給能做的大公司來做,我們跟他們合作,這纔是生存之道」。
零一萬物開始放棄自行訓練萬億參數模型,轉向針對電商直播、會議等場景的行業智能應用,推出 AI 數字人和「Yi」系列服務。雖未立刻倒閉,但其已清晰地從「造基座」往後撤步,調整為聚焦落地應用。
同樣,百川智能也顯示出戰略調整跡象。2024 年 7 月宣佈完成 50 億元人民幣 A 輪孖展,估值約 200 億元,投資方包括阿里、騰訊、小米等互聯網巨頭。百川主打醫療方向,大模型「百川-53B」於 2023 年底問世,AI 助手「百小應」上線,曾在 2024 年 WAIC 展台展示醫療問診應用。
而今年3 月中旬就有媒體爆出,百川兩位聯合創始人已經確認離職。股權回購與孖展併購也傳出爭議。此外,王小川在內部信中提到了成立兩年來百川智能的不足,稱公司「兩年來戰線拉得太長、不夠聚焦」,公司前後已經裁撤部分 ToB 金融部門,將重心迴歸醫療專家模型和百小應產品。可見百川雖依然獲得資金支撐,維持產品更新和生態拓展,但內部正在精簡業務以求聚焦。
月之暗面近期明顯收緊打法,縮減燒錢戰略。春節後有媒體披露,在DeepSeek攻勢之下,月之暗面決定大幅壓縮市場推廣預算,暫停多款安卓渠道投放並解除第三方廣告合作。公司內部將此歸因於「外部環境變化和戰略調整」,表明其營銷打法將更加謹慎。
此前,月之暗面曾以廣撒網的方式重點推廣AI助手Kimi,也在海外推出Ohai、Noisee等產品。但根據晚點財經報道,月之暗面今年9月已決定停止Ohai和Noisee的運營,將資源集中在覈心產品Kimi。有兩位負責海外產品的高管離職創業,創辦了定位於AI編程的公司。這些動向與資本市場的謹慎形成對照,不難看出,這家曾估值近25億美元的獨角獸在戰術上更加聚焦,降低了非核心業務拓展的投入。
而MiniMax的路徑選擇就顯得既謹慎又富有張力。這家曾因創始團隊出身商湯而備受矚目的公司,早期憑藉Talkie這類情感陪伴類應用快速打開海外市場,日交互量一度突破30億次,但如今卻面臨用戶增長乏力、留存率下滑的困境。當賽道瓶頸逐漸顯現,MiniMax繼而調整策略,逐漸淡出同質化嚴重的情感陪聊紅海,轉而將資源向視頻生成、音樂創作等更具技術壁壘的領域傾斜。
MiniMax作為國內首個自主研發MoE混合專家架構的團隊,他們早已不滿足於單一模態的較量,而是構建起覆蓋文本、語音、圖像、視頻的全矩陣模型體系。
產品佈局上,MiniMax採取To B與To C雙線並進的策略。To B端通過開放平台接入3萬家企業,覆蓋客服、教育等標準化場景以降低邊際成本;To C端則依靠星野、Talkie等情感陪伴應用積累日均30億次交互數據,但面臨用戶增長放緩、付費能力有限及海外監管風險。近期推出的海螺AI試圖以文生視頻、音樂生成等特色功能突破同質化競爭,但滲透率仍需提升。
今年3月,MiniMax雖獲6億美元A + 輪孖展,旗下Talkie應用日交互量超30億次,卻仍未找到穩定盈利模式。儘管有大量資金注入且產品有一定用戶活躍度,但MiniMax在盈利模式上尚未取得突破,目前仍在不斷嘗試和調整,以在競爭激烈的市場中找到可持續發展的道路。
總的來看,AI創業「小龍們」的走勢已有顯著差異,但是,這種趨勢並非敗退,而是行業成熟期必然的理性回調,最終目標是在巨頭夾縫中守住「小而美」的生存空間。
相反,以字節、阿里、騰訊為首的重量級玩家由於資金、人才、生態和數據積累優勢,正處於中場競賽的主動位置。未來誰能在「智能上限」和「多模態能力」上取得突破,還有待考驗。
但可以肯定的是,這場「中場戰事」已經由此前的狂飆突進轉向穩紮穩打的比拼,各路玩家都在砥礪技術、優化策略,一方面力圖保留優勢,一方面尋求新的成長路徑。要知道,「大模型的路要跑得清楚,最終還得落到產品上」,誰能走得更久、更穩,將決定這場AI競賽的下一階段格局。