羅福莉再發聲,Agent時代模型訂閱制涼了?

字母AI
04/08

「我會建議所有LLM公司,在搞清楚‘coding plan怎麼定價不虧錢’之前,不要盲目打價格戰。」近日,小米集團MiMo負責人羅福莉在X平台發文,談及針對眼下的Token定價問題發表看法。

讓羅福莉下場發聲的由頭很簡單:Anthropic在近期調整了產品策略,不再允許用Claude訂閱運行OpenClaw。

本月4日起,Claude的Pro和Max訂閱不再覆蓋OpenClaw等第三方框架,用戶如果還要繼續使用這些智能體,只能改為通過API按量付費或購買額外使用額度。

Claude官方解釋稱:這類調用對系統造成了「遠超預期的壓力」。

而幾乎在同一時間,MiMo也推出了自家的Token Plan。

「Claude Code的訂閱機制在計算資源分配上設計得非常漂亮。但我認為它並不賺錢甚至可能虧損,除非API利潤率高出10到20倍。」在文中,羅福莉這樣分析道。

除了呼籲不打價格戰,羅福莉的另一個核心觀點是:長期來看,Agent時代的模型正在迎接一個「被迫進化」的過程,優化上下文管理、複用已有計算結果、減少無效token消耗是接下來的迭代方向。

在她看來,Anthropic的這一步,正在推動整個生態向這個方向:讓高效的Agent和高效的模型協同進化。

不過,面對Anthropic這一策略調整,也有人選擇了不買賬。

OpenClaw作者Peter Steinberger在X上直接開噴,他表示,曾嘗試與Anthropic溝通,但最終只爭取到一周的緩衝時間。

OpenClaw的廣大用戶群體無疑是這一輪調整的最大受害者,很多用戶訂閱Claude,本來就是為了運行OpenClaw,而現在,這條路徑被直接切斷。

當原本被認為「高昂價格」的200美元的訂閱,突然間能跑出幾千美元的算力消耗,無疑是對廠商定價策略的一次考驗。

另一方面,這並非是一句簡單的「Token調用變多了」就能解釋的現象。Agent正在重塑Token的調用邏輯,而背後這筆賬,算起來還真有點複雜。

01

600倍浮動下,模型該怎麼定價

如果要用一個詞來解釋這場爭議的核心,那就是——波動,不可預測的波動。

南洋理工大學等團隊在近期發布的研究《Beyond Max Tokens》顯示,在多輪工具調用的智能體場景中,同一個任務的計算消耗,可能出現最高658倍的差異。

一條看起來類似的任務,有的幾千個計算單元就結束,有的則被拉到數萬甚至更高。這意味着,模型的成本不只是變得更高,而是不可預測。

「我仔細觀察過OpenClaw的上下文管理——做得不怎麼樣。」

解構羅福莉在X上的發言,你能發現和南洋理工這份研究的契合之處。羅福莉發現,在OpenClaw的一個用戶請求裏,往往會發起多輪低價值的工具調用,帶來了巨大的模型調用量的浪費。

「真實成本很可能是訂閱價格的幾十倍。這不是差距——這是一個‘深坑’。」

羅福莉所說「深坑」,問題出在OpenClaw這類智能體的運行方式:一個任務往往需要多輪嘗試和回退,很多計算並不會直接產生結果,但依然消耗資源。

但這個消耗資源的具體量級很難測算,這也是Claude選擇封禁掉訂閱接入Agent的渠道,而不是選擇新設立一個「合理」定價的訂閱套餐。

總而言之,隨着Agent生態加速演變,Token用量的「合理」範圍,壓根無法準確預估。

「我們一直在努力滿足不斷增長的Claude需求,但我們的訂閱服務並非為這些第三方工具的使用模式而設計的。」談及這一次業務調整,Claude Code負責人Boris Cherny此前在X上這樣寫道。

他表示:「Token是一種我們謹慎管理的資源,我們將優先考慮使用我們產品和API的客戶。」

對於這一調整帶來的影響,有業內分析稱之為「自助餐已經結束了」。OpenClaw開啓了Agent的大航海時代,但也推翻了此前的模型定價門檻。一個OpenClaw代理運行一天,就可能消耗1000到5000美元的API成本。

「Anthropic正在承擔每個通過第三方接口用戶所產生的這部分差價,」增長營銷專家Aakash Gupta在X上寫道。「這就是一家公司眼睜睜看着利潤實時蒸發的速度。」

成本完全失控,這是Anthropic不得不立刻做出反應的原因。

在Chatbot形態裏,訂閱制之所以能延續,是因為可以根據歷史數據,統計出一個代表大部分用戶的用量均值:輕度用戶覆蓋重度用戶,整體成本可以被攤平。

但在Agent場景中,這種結構被打破。重度使用不再是個例,而是由產品形態本身決定的結果。只要模型開始「執行任務」,就必然會出現長鏈路調用、上下文膨脹和重複嘗試。

類似的變化,其實已經在其他產品中出現。此前當Cursor在調整定價時,就從「按請求次數計費」轉向「按實際Token成本折算的額度」,原因同樣是長鏈路任務帶來的成本差異,已經無法用固定配額衡量。

不過,用Token作為唯一定價、實算實銷的方式雖然看起來很科學,但是也帶來了新的問題,Agent鏈路下Token用量不確定性依然存在,如果完全用實際Token用量覈算,相當於把這種不確定性轉嫁給了用戶。

因此,當Anthropic發表聲明後,用戶不買賬的聲音也此起彼伏。

X上有許多用戶表示,切換到API計費跑OpenClaw成本會嚴重攀升,使得他們不得不考慮其他途徑。

而已經被OpenAI「收編」的OpenClaw創始人Steinberger,在X上「開噴」也帶了一絲叫板的意味。

有外媒分析,OpenAI似乎正在將自己定位為一個更「易於上手」的替代方案,並可能利用這一契機,從不滿的Claude高級用戶那裏獲取客戶。

知名媒體Axios此前在報道中披露,曾有一位行業資深人士表示,「Anthropic強調訓練和運行模型的效率,而OpenAI的心態是,CEO奧特曼總能籌集到更多資金來支持計算規模的擴展。」

這場爭論的結局尚未可知,但毫無疑問的是,在2026年的AI領域,第三方自動化獲得補貼、無限計算能力的時代已經結束。

不管採用哪種計費邏輯,更謹慎、更細化的Token收費模式已在路上。

02

配額不是唯一出路,但已是眼下最優解

進一步討論定價問題前,有必要先解釋下目前模型產品的主流計費模式。

目前主流模型廠商大致形成「三層計費結構」。第一層是訂閱制,面向個人用戶,如ChatGPT Plus、Claude Pro、Gemini Advanced,按月收費,提供更強模型與更高調用上限,但通常伴隨速率與用量限制。

第二層是API按量計費,以OpenAI、Anthropic、Google以及國內火山引擎、阿里雲、智譜等公司,按token或等價計算量收費,是開發者與企業的核心結算方式。

在此之上,各家又推出Coding Plan/Token Plan等套餐,作為訂閱與按量之間的過渡形態:用戶按月付費獲得一定額度與優先權,但超額仍需按量付費,並伴隨公平使用與限流機制。

在Agent場景中,這一分層尤為關鍵,自動化調用大都只支持API按量計費,訂閱與套餐難以覆蓋高強度、多輪調用的算力消耗。而大部分「訂閱模式」只針對一般用戶的Chatbot和內嵌Agent功能。

隨着Anthropic針對Openclaw切換計費方式,其他廠商也相繼做出反應,是更直接的——漲價。

過去幾周時間裏,一輪集中調價出現在國內AI雲廠商中。

騰訊雲此前宣佈,自上月13日起結束部分模型的免費公測,並轉為正式收費,同時對混元系列模型進行大幅調價,部分價格漲幅超過400%。

隨後,阿里百度方面也發布公告,本月月中開始上調AI算力和存儲價格,整體漲幅在5%—30%區間。

而在幾天前智譜的財報電話會議上,CEO張鵬披露,2026年一季度接口調用價格提升了83%,但調用量仍然增長400%。

接連幾家AI雲廠商漲價,說明了一件事:模型需求的增長來得太快,甚至廠商的基建層都倍感壓力。

這一點在羅福莉的發文中也有體現:「更宏觀地看:全球的算力供給,跟不上agent帶來的token需求增長。」真正的出路,不是更便宜的token,而是模型和Agent的‘協同進化’。」

只是,在更高效的模型+Agent架構面世之前,漲價或者限制訂閱,並不能解決這套計費邏輯中的核心矛盾。

從用戶視角看,購買的是「任務完成」;但從模型廠商的視角,計量的是「計算過程」。

這兩者之間,目前存在着明顯的錯位。走訂閱,廠商要承擔Token調用不穩定的風險;走API,這個風險又來到了用戶身上。

這也是為什麼「訂閱+配額+API」的組合,同時出現在了各大廠商的落地方案中。

在Harness/Coding場景下,各類plan本質上是一種用戶與模型廠商之間的相互妥協:廠商通過Coding/Token Plan套餐鎖定一部分額度,換取用戶側的價格確定性,同時用限流和規則控制風險。

但在OpenClaw這類更不受控的agent場景中,調用強度和路徑都難以約束,這種「妥協」很難成立,廠商們更多選擇 API按量計費。

訂閱負責輕量使用,配額限制極端消耗,超額部分按量計費。本質上,這是一種對不確定性的緩衝機制。

不過,Token計價也並不是唯一的解法,行業內已經在探索一些「另類」的模型收費模式。

一類是按任務收費。比如Anthropic在Claude Code中推出的Code Review功能,直接按一次PR審查計價,單次review平均成本在15–25美元,並隨代碼規模和複雜度浮動。

二是按結果收費,已經在企業側落地,比如智能客服、RPA廠商按「問題解決」或「流程完成」計價;還有一種是按時間收費,比如xAI的語音agent按運行時長計費,約0.05美元/分鐘)。

幾天前,在火山引擎武漢站巡展活動中,當字母AI問及「面對模型調用激增、Token消耗存在不確定性的現狀,模型廠商該如何優化定價策略?」時,火山引擎總裁譚待這樣回應:

「目前OpenClaw這類通用型平台適合按Token收費,因為其應用場景廣泛,無法統一定義效果和成本。」譚待同時表示,未來可能會孵化出垂直領域的智能體,如客服智能體,就可以按回答問題的數量收費。「類似線下找客服的模式,按效果付費。」

「(Anthropic的這一步)大概率是一件好事。Agent時代不屬於消耗最多算力的人,而屬於最會使用算力的人。」在那篇發文最後,羅福莉這樣總結道。

顯然,圍繞Token收費的爭論還將持續下去,這一爭論將取決於未來模型-Agent在效率層面的迭代情況。

我們可以確定的是,過去一度被壓到幾釐錢每Token的單價,在這個調用量激增、鏈路無限延伸的Agent爆發周期,已經變成了每一個用戶都無法忽視的成本因素。

Agent大航海時代,Token收費這筆賬,值得每一個廠商認真盤一盤。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10