從閉源走向開源，Kimi艱難時期已過現在有3個重要變化

　　炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！

　　來源：晚點LatePost

　　文丨程曼祺

　　編輯丨宋瑋

　　《晚點 LatePost》獨家獲悉，Kimi （月之暗面）即將完成新一輪 20 億美元孖展，投後估值突破 200 億美元。本輪孖展由美團龍珠領投，中國移動、CPE（中信產業基金）等參投，其中僅龍珠就出手超 2 億美元。

　　今年 1 月和 2 月，Kimi 剛密集完成 3 輪孖展，分別融了 5 億美元、 7 億美元和 7 億美元。算上這筆最新孖展，不到半年裏，Kimi 孖展超 39 億美元，最新估值相比去年 11 月的約 43 億美元翻了 4 倍有餘。

　　至此，Kimi 累計孖展額已超 376 億人民幣，成為大模型創業公司中累計孖展最多的公司。算上 IPO 募資，MiniMax 累計孖展約 150 億人民幣，智譜約 130 億人民幣。截至 5 月 6 日午間休市，MiniMax 市值約 2100 億人民幣，智譜約 3470 億人民幣。

　　美團龍珠合夥人王新宇告訴我們，K2.5 模型更新後，Kimi ARR（年度經常性收入）在今年 3 月初突破 1 億美元，在 4 月繼續增長至超 2 億美元，付費訂閱和 API 調用都在加速。

　　完成新孖展前夕，Kimi 最新模型 K2.6 在 4 月 20 日晚發布並開源。K2.6 強化了編程能力和 Agent 集群能力，可支持最多 300 個子 Agent 協作，Kimi 也開始同步測試 Claw 群組新功能。

　　這此前的一年多，Kimi 經歷了戰略、士氣和投孖展行情的多方面觸底反彈。

　　2025 年 1 月 20 日，Kimi 發布推理模型 Kimi K1.5，對標 OpenAI o1 。同一天，DeepSeek 發布並開源 DeepSeek-R1。

　　儘管 K1.5 在一些 benchmark 上超越了當時的領先模型 GPT-4o 和 Claude 3.5 Sonnet ，但市場注意力幾乎全被 DeepSeek 吸引。隨後的 2025 年春節，DeepSeek 以 0 投放斬獲數千萬日活，一舉超越 2024 年大額投放的 Kimi，也一度超越了字節豆包。

　　那是 Kimi 的艱難時期。2025 年春節後，kimi 有了 3 個重要變化：

　　- 以「持續拿到 SOTA（模型最佳表現）」為最優先級目標。

　　- 大幅減少 C 端投放。

　　- 從閉源走向開源。

　　那之後，Kimi 在方向選擇和具體技術成果上都有不錯的表現。

　　選定 coding 和 Agent：「生產力優先」落到了行動

　　和智譜類似，Kimi 是中國公司中較早開始側重編程能力的團隊，而編程又是通用 Agent 的最核心能力。

　　這與楊植麟一直說的「生產力場景優先」、「效率場景優先」一脈相承。但在 2024 年，Kimi 動作依然發散，也嘗試過海外 to C 產品和視頻生成。

　　2025 年後，Kimi 更加聚焦。這一年 7 月開源的 Kimi K2 和 2026 年 1 月至今的 K2.5 與 K2.6 都在持續強化編程和 Agent 能力。

　　其中，K2 是一款 Kimi 借鑑 DeepSeek 經驗，補課預訓練能力後的模型，採取了與 DeepSeek-V3 類似的 MoE（混合專家模型）與 MLA（Multi-Head Latent Attention，多頭潛在注意力）架構，把總參數擴展到 1T（萬億參數），強化了編程和多輪工具調用等 agent 能力。2 個月後，Kimi 推出 Agent 功能「OK Computer」（後改名 Kimi Agent）。K2.5 則首次引入視覺能力，並開始支持智能體群模式。

　　K2.5 對編程和 Agent 的優化適用於 OpenClaw（業內稱「龍蝦」），Kimi 也迅速在 2 月 15 日推出了雲端龍蝦 Kimi Claw，支持低門檻的一鍵部署。

　　模型進化疊加產品更新，Kimi 今年以來的收入、訂閱用戶數大幅增長。

　　- 據全球支付平台 Stripe 數據，自 2026 年 1 月底以來，Kimi 近 20 天收入超越 2025 年全年總和。其個人訂閱用戶 1 月支付訂單數按月增長超 8000%，2 月按月再升逾 120%。

　　- 據 Similarweb 數據，Kimi 海外 API 開放平台在 K2.5 發布後日均訪問量暴漲 10-20 倍。

　　MuonClip、Attention Residuals，技術影響力顯現

　　在具體技術成果上，2025 年年初，Kimi 在 16B 的 Moonlight 模型上驗證了 Keller Jordan 2024 年開源的 Muon 優化器（原初版本是在 1.5B 模型上做驗證），後來又在 1T 規模的 K2 上提出 Muon 的一個改進版 MuonClip，後被廣泛採用。

　　Kimi 創始人楊植麟曾在多個公開場合提及這一成果，以此作為技術「taste」的例子。啱啱發布的 DeepSeek-V4 也使用了 Muon 優化器，並進一步提出了新改進。

　　Moonlight 共同一作之一 Jingyuan Liu 已於 2025 年年中加入 Meta，目前任職於 Meta 超級智能實驗室（MSL）。

　　2025 年 10 月，Kimi 推出實驗性的線性注意力架構模型 Kimi-Liner。該模型在開源的 DeltNet Attention 基礎上做了進一步修改。

　　為更好探索線性注意力，Kimi 從 AI 研究者楊松林發起的 FLA 線性注意力開源社區中招募了貢獻頗多的活躍開發者張宇和陳廣宇。張宇是蘇州大學計算機科學與技術學院博士，陳廣宇是一位高中生。

　　2026 年 3 月，Kimi 提出 Attention Residuals（注意力殘差），它引入了 Transformer 中的注意力機制，解決傳統殘差連接（Residual Connection）的信息稀釋、訓練不穩定等痛點。殘差鏈接是深度神經網絡已使用十幾年的一項基礎技術。馬斯克在推特轉發了這個成果，「Impressive work from Kimi」。

　　Attention Residuals 有三位核心作者：Kimi 從 FLA 社區挖掘的陳廣宇和張宇，還有人稱「蘇神」的蘇劍林。他是大模型中廣泛使用的 RoPE（旋轉式位置編碼）的作者，獨自一人在廣州工作。

　　Attention Residuals 與 DeepSeek 2025 年年底的 mHC（Manifold-Constrained Hyper-Connections 流形約束超連接）想實現的效果有相似之處。而 mHC 改進的 HC 又是字節跳動 Seed 團隊提出的。

　　HC、mHC、Attention Residuals，這些接連出現的技術改進是中國 AI 人才密度與競爭烈度的產物。

　　從「太貴」到「好便宜」

　　2024 年底，《晚點 LatePost》曾在《中國大模型生存戰：巨頭圍剿，創業難熬》裏提到，面對「會跳舞的大象」字節，中國一批大模型創業公司壓力巨大。

　　18 個月來，兩個關鍵事件使創業公司的「一線生機」逐漸打開。

　　一是 DeepSeek-R1 使開源模型生態真正繁榮、活躍，衆多開源模型之間的技術交流加速了大模型進化；二是 Agent 應用加快普及，同期上市的智譜、MiniMax 股價趁勢大漲，刺激更多資金涌向大模型行業。

　　目前，MiniMax 和智譜的市值在 2000~4000 億人民之間波動。這讓估值約 1400 億人民幣的 Kimi 成為一個熱門投資標的。

　　接下來，這些模型公司面臨的重要課題是繼續保持模型 SOTA 和驗證「token」經濟的商業模式。

　　模型能力的核心是人才。2026 年初，Kimi 創始人楊植麟在全員信中提到：2026 年公司平均激勵將是 2025 年的 200%，並計劃大幅上調期權回購額度。

　　2026 年 4 月初，《晚點 LatePost》也報道了 Kimi 給實習生髮期權「穿越計劃」。由於 Kimi 估值在數月內就翻了 4 倍多、且尚未上市，它的期權變得有吸引力。

　　儘管如此，Kimi 現在正面臨不小的人才壓力，由於其在編程、 agent 等領域的優異表現和這一應用方向的白熱化競爭，Kimi 相關人員已成為競爭對手的重點挖角對象。

　　而在商業模式上，中國大模型創業公司普遍在用兩種方式賺取收入：一是通過 API 提供模型，按 token 實際用量來收費；二是基於自己的模型做應用，獲取按月/年定額的付費用戶。能否及時獲得高質量算力，能否以高效推理控制好成本，以及能否用產品體驗帶來「溢價」是證明商業模式的關鍵。獲得足夠多的錢是這一切的基礎。

海量資訊、精準解讀，盡在新浪財經APP

責任編輯：劉萬里 SF014

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

從閉源走向開源，Kimi艱難時期已過現在有3個重要變化

熱議股票

從閉源走向開源，Kimi艱難時期已過 現在有3個重要變化

熱議股票

從閉源走向開源，Kimi艱難時期已過現在有3個重要變化