小米羅福莉談Token價格戰:建議LLM公司不要盲目壓低價格,會導致惡性循環

IT之家
04/07

IT之家 4 月 7 日消息,小米集團 MiMo 負責人羅福莉昨天在 X 平台發文,談及最近 AI 業界火熱的 Token(IT之家注:詞元)價格戰。

圖源:羅福莉本人社媒賬號

羅福莉表示,Anthropic 幾天前切斷了 Claude 第三方工具訂閱通道;並且 MiMo 也在幾天前推出了 Token Plan,於是她有感而發:

1、Claude Code 的訂閱機制在計算資源分配上設計得非常漂亮。但我認為它並不賺錢甚至可能虧損,除非 API 利潤率高出 10 到 20 倍。

我無法精確計算第三方框架接入後帶來的損失,但我仔細研究 OpenClaw 的上下文管理後發現它很糟糕。例如在一次用戶請求中,OpenClaw 會觸發多輪低價值的工具調用,每一次都是獨立的 API 請求,而且都攜帶超長上下文(通常超過 10 萬 tokens)。

即便有緩存命中,這種方式仍然非常浪費;在極端情況下,還會提高其他請求的緩存未命中率。

這就導致每個用戶實際觸發的 API 調用次數往往是 Claude Code 原生框架的數倍。換算成 API 成本很可能是訂閱價格的幾十倍。這已經不是「差距」,而是「巨大鴻溝」。

2、OpenClaw、OpenCode 等第三方框架仍然可以通過 API 調用 Claude,只不過不能再「搭便車」使用訂閱額度。

短期來看,這些智能體的用戶會感受到成本壓力,費用可能輕鬆上漲幾十倍。但這種壓力會迫使上述框架優化上下文管理、提高提示詞緩存命中率,減少 Token 浪費。

這種痛苦最終會轉化為工程上的自律。

3、我建議各大 LLM 公司,在搞清楚如何設計一個不虧錢的編程訂閱方案之前,不要盲目去打價格戰。

把 Token 價格壓得很低、同時完全開放第三方框架看起來對用戶很友好,但這其實就陷入了 Anthropic 剛走出的陷阱。

並且更深層的問題在於,如果用戶把注意力消耗在低質量 Agent 框架上,那麼面對不穩定且緩慢的推理服務時,就只能使用降級過的節省成本大模型,結果仍然無法完成任務。這對於用戶體驗、留存來說無異於惡性循環。

4、關於 MiMo 的 Token Plan 計劃:它支持第三方工具,按 Token 計費,與 Claude 新推出的額外使用套餐邏輯相同。我們的目標是長期穩定地提供高品質服務,而不是讓您衝動消費後棄坑。

從宏觀角度看,全球計算資源增長的腳步已跟不上 Agent 帶來的 Token 需求增長。真正的出路不是提供更便宜的 Token,而是讓「更高效的 Agent 框架」 × 「更強大且更高效的模型」協同演進。

Anthropic 的這次舉措無論是否出於本意,都在推動開源、閉源生態發展,這或許是一件好事。

Agent 時代不屬於消耗最多算力的人,而屬於最懂得如何高效利用算力的人

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10