羅福莉再發聲，Agent時代模型訂閱制涼了？

「我會建議所有LLM公司，在搞清楚‘coding plan怎麼定價不虧錢’之前，不要盲目打價格戰。」近日，小米集團MiMo負責人羅福莉在X平台發文，談及針對眼下的Token定價問題發表看法。

讓羅福莉下場發聲的由頭很簡單：Anthropic在近期調整了產品策略，不再允許用Claude訂閱運行OpenClaw。

本月4日起，Claude的Pro和Max訂閱不再覆蓋OpenClaw等第三方框架，用戶如果還要繼續使用這些智能體，只能改為通過API按量付費或購買額外使用額度。

Claude官方解釋稱：這類調用對系統造成了「遠超預期的壓力」。

而幾乎在同一時間，MiMo也推出了自家的Token Plan。

「Claude Code的訂閱機制在計算資源分配上設計得非常漂亮。但我認為它並不賺錢甚至可能虧損，除非API利潤率高出10到20倍。」在文中，羅福莉這樣分析道。

除了呼籲不打價格戰，羅福莉的另一個核心觀點是：長期來看，Agent時代的模型正在迎接一個「被迫進化」的過程，優化上下文管理、複用已有計算結果、減少無效token消耗是接下來的迭代方向。

在她看來，Anthropic的這一步，正在推動整個生態向這個方向：讓高效的Agent和高效的模型協同進化。

不過，面對Anthropic這一策略調整，也有人選擇了不買賬。

OpenClaw作者Peter Steinberger在X上直接開噴，他表示，曾嘗試與Anthropic溝通，但最終只爭取到一周的緩衝時間。

OpenClaw的廣大用戶群體無疑是這一輪調整的最大受害者，很多用戶訂閱Claude，本來就是為了運行OpenClaw，而現在，這條路徑被直接切斷。

當原本被認為「高昂價格」的200美元的訂閱，突然間能跑出幾千美元的算力消耗，無疑是對廠商定價策略的一次考驗。

另一方面，這並非是一句簡單的「Token調用變多了」就能解釋的現象。Agent正在重塑Token的調用邏輯，而背後這筆賬，算起來還真有點複雜。

600倍浮動下，模型該怎麼定價

如果要用一個詞來解釋這場爭議的核心，那就是——波動，不可預測的波動。

南洋理工大學等團隊在近期發布的研究《Beyond Max Tokens》顯示，在多輪工具調用的智能體場景中，同一個任務的計算消耗，可能出現最高658倍的差異。

一條看起來類似的任務，有的幾千個計算單元就結束，有的則被拉到數萬甚至更高。這意味着，模型的成本不只是變得更高，而是不可預測。

「我仔細觀察過OpenClaw的上下文管理——做得不怎麼樣。」

解構羅福莉在X上的發言，你能發現和南洋理工這份研究的契合之處。羅福莉發現，在OpenClaw的一個用戶請求裏，往往會發起多輪低價值的工具調用，帶來了巨大的模型調用量的浪費。

「真實成本很可能是訂閱價格的幾十倍。這不是差距——這是一個‘深坑’。」

羅福莉所說「深坑」，問題出在OpenClaw這類智能體的運行方式：一個任務往往需要多輪嘗試和回退，很多計算並不會直接產生結果，但依然消耗資源。

但這個消耗資源的具體量級很難測算，這也是Claude選擇封禁掉訂閱接入Agent的渠道，而不是選擇新設立一個「合理」定價的訂閱套餐。

總而言之，隨着Agent生態加速演變，Token用量的「合理」範圍，壓根無法準確預估。

「我們一直在努力滿足不斷增長的Claude需求，但我們的訂閱服務並非為這些第三方工具的使用模式而設計的。」談及這一次業務調整，Claude Code負責人Boris Cherny此前在X上這樣寫道。

他表示：「Token是一種我們謹慎管理的資源，我們將優先考慮使用我們產品和API的客戶。」

對於這一調整帶來的影響，有業內分析稱之為「自助餐已經結束了」。OpenClaw開啓了Agent的大航海時代，但也推翻了此前的模型定價門檻。一個OpenClaw代理運行一天，就可能消耗1000到5000美元的API成本。

「Anthropic正在承擔每個通過第三方接口用戶所產生的這部分差價，」增長營銷專家Aakash Gupta在X上寫道。「這就是一家公司眼睜睜看着利潤實時蒸發的速度。」

成本完全失控，這是Anthropic不得不立刻做出反應的原因。

在Chatbot形態裏，訂閱制之所以能延續，是因為可以根據歷史數據，統計出一個代表大部分用戶的用量均值：輕度用戶覆蓋重度用戶，整體成本可以被攤平。

但在Agent場景中，這種結構被打破。重度使用不再是個例，而是由產品形態本身決定的結果。只要模型開始「執行任務」，就必然會出現長鏈路調用、上下文膨脹和重複嘗試。

類似的變化，其實已經在其他產品中出現。此前當Cursor在調整定價時，就從「按請求次數計費」轉向「按實際Token成本折算的額度」，原因同樣是長鏈路任務帶來的成本差異，已經無法用固定配額衡量。

不過，用Token作為唯一定價、實算實銷的方式雖然看起來很科學，但是也帶來了新的問題，Agent鏈路下Token用量不確定性依然存在，如果完全用實際Token用量覈算，相當於把這種不確定性轉嫁給了用戶。

因此，當Anthropic發表聲明後，用戶不買賬的聲音也此起彼伏。

X上有許多用戶表示，切換到API計費跑OpenClaw成本會嚴重攀升，使得他們不得不考慮其他途徑。

而已經被OpenAI「收編」的OpenClaw創始人Steinberger，在X上「開噴」也帶了一絲叫板的意味。

有外媒分析，OpenAI似乎正在將自己定位為一個更「易於上手」的替代方案，並可能利用這一契機，從不滿的Claude高級用戶那裏獲取客戶。

知名媒體Axios此前在報道中披露，曾有一位行業資深人士表示，「Anthropic強調訓練和運行模型的效率，而OpenAI的心態是，CEO奧特曼總能籌集到更多資金來支持計算規模的擴展。」

這場爭論的結局尚未可知，但毫無疑問的是，在2026年的AI領域，第三方自動化獲得補貼、無限計算能力的時代已經結束。

不管採用哪種計費邏輯，更謹慎、更細化的Token收費模式已在路上。

配額不是唯一出路，但已是眼下最優解

進一步討論定價問題前，有必要先解釋下目前模型產品的主流計費模式。

目前主流模型廠商大致形成「三層計費結構」。第一層是訂閱制，面向個人用戶，如ChatGPT Plus、Claude Pro、Gemini Advanced，按月收費，提供更強模型與更高調用上限，但通常伴隨速率與用量限制。

第二層是API按量計費，以OpenAI、Anthropic、Google以及國內火山引擎、阿里雲、智譜等公司，按token或等價計算量收費，是開發者與企業的核心結算方式。

在此之上，各家又推出Coding Plan/Token Plan等套餐，作為訂閱與按量之間的過渡形態：用戶按月付費獲得一定額度與優先權，但超額仍需按量付費，並伴隨公平使用與限流機制。

在Agent場景中，這一分層尤為關鍵，自動化調用大都只支持API按量計費，訂閱與套餐難以覆蓋高強度、多輪調用的算力消耗。而大部分「訂閱模式」只針對一般用戶的Chatbot和內嵌Agent功能。

隨着Anthropic針對Openclaw切換計費方式，其他廠商也相繼做出反應，是更直接的——漲價。

過去幾周時間裏，一輪集中調價出現在國內AI雲廠商中。

騰訊雲此前宣佈，自上月13日起結束部分模型的免費公測，並轉為正式收費，同時對混元系列模型進行大幅調價，部分價格漲幅超過400%。

隨後，阿里和百度方面也發布公告，本月月中開始上調AI算力和存儲價格，整體漲幅在5%—30%區間。

而在幾天前智譜的財報電話會議上，CEO張鵬披露，2026年一季度接口調用價格提升了83%，但調用量仍然增長400%。

接連幾家AI雲廠商漲價，說明了一件事：模型需求的增長來得太快，甚至廠商的基建層都倍感壓力。

這一點在羅福莉的發文中也有體現：「更宏觀地看：全球的算力供給，跟不上agent帶來的token需求增長。」真正的出路，不是更便宜的token，而是模型和Agent的‘協同進化’。」

只是，在更高效的模型+Agent架構面世之前，漲價或者限制訂閱，並不能解決這套計費邏輯中的核心矛盾。

從用戶視角看，購買的是「任務完成」；但從模型廠商的視角，計量的是「計算過程」。

這兩者之間，目前存在着明顯的錯位。走訂閱，廠商要承擔Token調用不穩定的風險；走API，這個風險又來到了用戶身上。

這也是為什麼「訂閱+配額+API」的組合，同時出現在了各大廠商的落地方案中。

在Harness/Coding場景下，各類plan本質上是一種用戶與模型廠商之間的相互妥協：廠商通過Coding/Token Plan套餐鎖定一部分額度，換取用戶側的價格確定性，同時用限流和規則控制風險。

但在OpenClaw這類更不受控的agent場景中，調用強度和路徑都難以約束，這種「妥協」很難成立，廠商們更多選擇 API按量計費。

訂閱負責輕量使用，配額限制極端消耗，超額部分按量計費。本質上，這是一種對不確定性的緩衝機制。

不過，Token計價也並不是唯一的解法，行業內已經在探索一些「另類」的模型收費模式。

一類是按任務收費。比如Anthropic在Claude Code中推出的Code Review功能，直接按一次PR審查計價，單次review平均成本在15–25美元，並隨代碼規模和複雜度浮動。

二是按結果收費，已經在企業側落地，比如智能客服、RPA廠商按「問題解決」或「流程完成」計價；還有一種是按時間收費，比如xAI的語音agent按運行時長計費，約0.05美元/分鐘）。

幾天前，在火山引擎武漢站巡展活動中，當字母AI問及「面對模型調用激增、Token消耗存在不確定性的現狀，模型廠商該如何優化定價策略？」時，火山引擎總裁譚待這樣回應：

「目前OpenClaw這類通用型平台適合按Token收費，因為其應用場景廣泛，無法統一定義效果和成本。」譚待同時表示，未來可能會孵化出垂直領域的智能體，如客服智能體，就可以按回答問題的數量收費。「類似線下找客服的模式，按效果付費。」

「（Anthropic的這一步）大概率是一件好事。Agent時代不屬於消耗最多算力的人，而屬於最會使用算力的人。」在那篇發文最後，羅福莉這樣總結道。

顯然，圍繞Token收費的爭論還將持續下去，這一爭論將取決於未來模型-Agent在效率層面的迭代情況。

我們可以確定的是，過去一度被壓到幾釐錢每Token的單價，在這個調用量激增、鏈路無限延伸的Agent爆發周期，已經變成了每一個用戶都無法忽視的成本因素。

Agent大航海時代，Token收費這筆賬，值得每一個廠商認真盤一盤。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

羅福莉再發聲，Agent時代模型訂閱制涼了？

熱議股票