炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
來源:晚點LatePost
文丨程曼祺
編輯丨宋瑋
《晚點 LatePost》獨家獲悉,Kimi (月之暗面)即將完成新一輪 20 億美元孖展,投後估值突破 200 億美元。本輪孖展由美團龍珠領投,中國移動、CPE(中信產業基金)等參投,其中僅龍珠就出手超 2 億美元。
今年 1 月和 2 月,Kimi 剛密集完成 3 輪孖展 ,分別融了 5 億美元、 7 億美元和 7 億美元。算上這筆最新孖展,不到半年裏,Kimi 孖展超 39 億美元,最新估值相比去年 11 月的約 43 億美元翻了 4 倍有餘。
至此,Kimi 累計孖展額已超 376 億人民幣,成為大模型創業公司中累計孖展最多的公司。算上 IPO 募資,MiniMax 累計孖展約 150 億人民幣,智譜約 130 億人民幣。截至 5 月 6 日午間休市,MiniMax 市值約 2100 億人民幣,智譜約 3470 億人民幣。
美團龍珠合夥人王新宇告訴我們,K2.5 模型更新後,Kimi ARR(年度經常性收入)在今年 3 月初突破 1 億美元,在 4 月繼續增長至超 2 億美元,付費訂閱和 API 調用都在加速。
完成新孖展前夕,Kimi 最新模型 K2.6 在 4 月 20 日晚發布並開源。K2.6 強化了編程能力和 Agent 集群能力,可支持最多 300 個子 Agent 協作,Kimi 也開始同步測試 Claw 群組新功能。
這此前的一年多,Kimi 經歷了戰略、士氣和投孖展行情的多方面觸底反彈。
2025 年 1 月 20 日,Kimi 發布推理模型 Kimi K1.5,對標 OpenAI o1 。同一天,DeepSeek 發布並開源 DeepSeek-R1。
儘管 K1.5 在一些 benchmark 上超越了當時的領先模型 GPT-4o 和 Claude 3.5 Sonnet ,但市場注意力幾乎全被 DeepSeek 吸引。隨後的 2025 年春節,DeepSeek 以 0 投放斬獲數千萬日活,一舉超越 2024 年大額投放的 Kimi,也一度超越了字節豆包。
那是 Kimi 的艱難時期。2025 年春節後,kimi 有了 3 個重要變化:
- 以 「持續拿到 SOTA(模型最佳表現)」 為最優先級目標。
- 大幅減少 C 端投放。
- 從閉源走向開源。
那之後,Kimi 在方向選擇和具體技術成果上都有不錯的表現。
選定 coding 和 Agent:「生產力優先」 落到了行動
和智譜類似,Kimi 是中國公司中較早開始側重編程能力的團隊,而編程又是通用 Agent 的最核心能力。
這與楊植麟一直說的 「生產力場景優先」、「效率場景優先」 一脈相承。但在 2024 年,Kimi 動作依然發散,也嘗試過海外 to C 產品和視頻生成。
2025 年後,Kimi 更加聚焦。這一年 7 月開源的 Kimi K2 和 2026 年 1 月至今的 K2.5 與 K2.6 都在持續強化編程和 Agent 能力。
其中,K2 是一款 Kimi 借鑑 DeepSeek 經驗,補課預訓練能力後的模型,採取了與 DeepSeek-V3 類似的 MoE(混合專家模型)與 MLA(Multi-Head Latent Attention,多頭潛在注意力)架構,把總參數擴展到 1T(萬億參數),強化了編程和多輪工具調用等 agent 能力。2 個月後,Kimi 推出 Agent 功能 「OK Computer」(後改名 Kimi Agent)。K2.5 則首次引入視覺能力,並開始支持智能體群模式。

K2.5 對編程和 Agent 的優化適用於 OpenClaw(業內稱 「龍蝦」),Kimi 也迅速在 2 月 15 日推出了雲端龍蝦 Kimi Claw,支持低門檻的一鍵部署。
模型進化疊加產品更新,Kimi 今年以來的收入、訂閱用戶數大幅增長。
- 據全球支付平台 Stripe 數據,自 2026 年 1 月底以來,Kimi 近 20 天收入超越 2025 年全年總和。其個人訂閱用戶 1 月支付訂單數按月增長超 8000%,2 月按月再升逾 120%。
- 據 Similarweb 數據,Kimi 海外 API 開放平台在 K2.5 發布後日均訪問量暴漲 10-20 倍。
MuonClip、Attention Residuals,技術影響力顯現
在具體技術成果上,2025 年年初,Kimi 在 16B 的 Moonlight 模型上驗證了 Keller Jordan 2024 年開源的 Muon 優化器(原初版本是在 1.5B 模型上做驗證),後來又在 1T 規模的 K2 上提出 Muon 的一個改進版 MuonClip,後被廣泛採用。
Kimi 創始人楊植麟曾在多個公開場合提及這一成果,以此作為技術 「taste」 的例子。啱啱發布的 DeepSeek-V4 也使用了 Muon 優化器,並進一步提出了新改進。
Moonlight 共同一作之一 Jingyuan Liu 已於 2025 年年中加入 Meta,目前任職於 Meta 超級智能實驗室(MSL)。
2025 年 10 月,Kimi 推出實驗性的線性注意力架構模型 Kimi-Liner。該模型在開源的 DeltNet Attention 基礎上做了進一步修改。
為更好探索線性注意力,Kimi 從 AI 研究者楊松林發起的 FLA 線性注意力開源社區中招募了貢獻頗多的活躍開發者張宇和陳廣宇。張宇是蘇州大學計算機科學與技術學院博士,陳廣宇是一位高中生。
2026 年 3 月,Kimi 提出 Attention Residuals(注意力殘差),它引入了 Transformer 中的注意力機制,解決傳統殘差連接(Residual Connection)的信息稀釋、訓練不穩定等痛點。殘差鏈接是深度神經網絡已使用十幾年的一項基礎技術。馬斯克在推特轉發了這個成果,「Impressive work from Kimi」。
Attention Residuals 有三位核心作者:Kimi 從 FLA 社區挖掘的陳廣宇和張宇,還有人稱 「蘇神」 的蘇劍林。他是大模型中廣泛使用的 RoPE(旋轉式位置編碼)的作者,獨自一人在廣州工作。
Attention Residuals 與 DeepSeek 2025 年年底的 mHC(Manifold-Constrained Hyper-Connections 流形約束超連接) 想實現的效果有相似之處。而 mHC 改進的 HC 又是字節跳動 Seed 團隊提出的。
HC、mHC、Attention Residuals,這些接連出現的技術改進是中國 AI 人才密度與競爭烈度的產物。
從 「太貴」 到 「好便宜」
2024 年底,《晚點 LatePost》曾在《中國大模型生存戰:巨頭圍剿,創業難熬》裏提到,面對 「會跳舞的大象」 字節,中國一批大模型創業公司壓力巨大。
18 個月來,兩個關鍵事件使創業公司的 「一線生機」 逐漸打開。
一是 DeepSeek-R1 使開源模型生態真正繁榮、活躍,衆多開源模型之間的技術交流加速了大模型進化;二是 Agent 應用加快普及,同期上市的智譜、MiniMax 股價趁勢大漲,刺激更多資金涌向大模型行業。
目前,MiniMax 和智譜的市值在 2000~4000 億人民之間波動。這讓估值約 1400 億人民幣的 Kimi 成為一個熱門投資標的。
接下來,這些模型公司面臨的重要課題是繼續保持模型 SOTA 和驗證 「token」 經濟的商業模式。
模型能力的核心是人才。2026 年初,Kimi 創始人楊植麟在全員信中提到:2026 年公司平均激勵將是 2025 年的 200%,並計劃大幅上調期權回購額度 。
2026 年 4 月初,《晚點 LatePost》也報道了 Kimi 給實習生髮期權 「穿越計劃」。由於 Kimi 估值在數月內就翻了 4 倍多、且尚未上市,它的期權變得有吸引力。
儘管如此,Kimi 現在正面臨不小的人才壓力,由於其在編程、 agent 等領域的優異表現和這一應用方向的白熱化競爭,Kimi 相關人員已成為競爭對手的重點挖角對象。
而在商業模式上,中國大模型創業公司普遍在用兩種方式賺取收入:一是通過 API 提供模型,按 token 實際用量來收費;二是基於自己的模型做應用,獲取按月/年定額的付費用戶。能否及時獲得高質量算力,能否以高效推理控制好成本,以及能否用產品體驗帶來 「溢價」 是證明商業模式的關鍵。獲得足夠多的錢是這一切的基礎。
責任編輯:劉萬里 SF014