誰來管住失控的token?

字母榜
06/09

今年以來,Token經濟概念火爆全球。但在啱啱過去的5月底,亞馬遜卻選擇關閉內部AI使用排行榜「KiroRank」。

這個排行榜原本統計員工在Kiro開發平台上的Token消耗。然而,排行榜啓用後,一些員工讓AI執行無意義任務,只為把使用量刷高。

亞馬遜高級副總裁Dave Treadwell隨後提醒員工,不要為了使用AI而使用AI。外媒報道稱,亞馬遜已經把考覈重點從原始Token消耗轉向「標準化部署」,也就是工程師用AI實際交付了多少可用結果。

企業AI第一輪熱潮裏,管理層最常問的是員工有沒有用AI,部門有沒有接入AI,業務有沒有做Agent。KiroRank關閉後,第一批大規模應用AI的企業,開始面對另一個問題:AI用量被推高以後,誰能證明它帶來了業務結果?

本月初,一個新詞開始在美國企業AI圈層流行:AI sticker shock(AI賬單震驚)。

按量計費的AI產品進入企業後,企業用戶發現支出賬單變得難以預測。Agent進入企業後,又面臨海量Token消耗帶來的成本攀升。

於是,一個問題被反覆提及:企業真正需要的Agent平台,究竟應該是什麼樣?

這個由Agent生態引發的系統性問題,正在等待新一代企業級AI平台作答。

01

失控的Token

亞馬遜關閉內部AI排行榜「KiroRank」背後,是企業大量應用AI後,Token反而「失控」的現實。

亞馬遜原本希望用排行榜鼓勵工程師使用Kiro開發平台,但結果是一些員工讓AI執行無意義任務,把使用量刷高。

這是企業AI落地後的第一重困境:用量會失真。員工用了多少AI,部門建了多少Agent,都可以出現在彙報文檔上。但企業真正關心的是,項目有沒有推進,Agent做出了多少產出,人工鏈路有沒有被縮短。

瑞典金融科技公司Klarna也在客服場景遇到了相似困境。

2024年,Klarna曾對外稱,AI客服承擔了相當於700名全職客服的工作。一年後,公司開始重新招聘人工客服。Klarna CEO Siemiatkowski承認,過度轉向AI影響了服務質量。

Klarna前後兩次動作,讓行業開始重新審視:AI節省下來的成本,如果換來更多複覈成本,就不能稱得上是靠譜的生產力。

在組織管理側,企業大規模引入AI後的資源配置問題也開始顯現。

澳大利亞聯邦銀行CEO Matt Comyn在近期談到,企業把AI用於更復雜任務後,相關成本會變得更難預測。他還批評低價值AI產出正在增加,用「work slop」(AI工作垃圾)形容那些看似完成工作,實際價值有限的內容。

換言之,AI消耗了很多Token,組織未必獲得更多結果。

這也是一些諮詢機構調低Agent項目預期的原因。

國際研究與諮詢機構高德納(Gartner)預計,到2027年底,超過40%的Agentic AI項目會因為成本上升、業務價值不清或風險控制不足被取消。Agent項目能否持續,不只取決於模型能力,也取決於企業能否把它放進真正的生產流程。

成本和效率之外,Agent進入企業生產流程後,還會把安全問題推到台前。

本月初,Meta一款用於Instagram賬號支持的AI客服機器人,被安全研究人員發現存在漏洞。攻擊者通過設計特殊話術誘導AI執行錯誤操作,最終獲得多個高影響力賬號的控制權限,其中包括奧巴馬白宮賬號,絲芙蘭等知名品牌賬號。

當Agent開始連接企業系統後,這類錯誤操作可能在更長鏈路中引發連鎖反應。它不只是回答錯一句話,而可能錯誤修改賬號信息,觸發業務操作,或者訪問本不該訪問的數據。

成本同樣是繞不開的一環。

此前,一篇新加坡南洋理工團隊的研究提到,在工具調用鏈場景下,Agent可能被引導進入極長調用鏈,實驗中單次查詢成本最高被放大658倍,能耗提升100到560倍。隨着Agent接入MCP,插件和企業內部系統,傳統按Token計費開始面臨新的挑戰。

企業今天面對的,已經不是簡單的「接入AI」問題,而是如何讓Agent真正實現有效產出。

「AI下半場更難的是尋找好問題,好場景和好環境。」

在近日舉行的2026騰訊雲AI產業應用大會上,騰訊首席AI科學家、騰訊混元大語言模型及AI Infra負責人姚順雨這樣說道。

行業高速變遷下,模型能做的事情越來越多,但企業仍要回答,什麼纔是值得被Agent解決的問題。

02

可靠的Agent,才能進入系統層

「今天AI原生服務的推理成本仍然較高,用戶提交的任務複雜度不同,成本消耗差異也很大。」在會後的採訪環節,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生,把問題拉回企業AI落地本身。

這也解釋了為什麼企業級Agent面臨的「痛點」。當Agent真正進入生產流程後,企業更關心的是三件事:哪些業務場景值得做,Agent接入系統後能不能被安全管理,最後有沒有形成可覈算的業務結果。

會上,騰訊雲智能體開發平台4.0的推出,讓這一話題再度引發討論。它瞄準的正是Agent進入企業生產環節後面對的這些問題,定位為企業級AgentOps平台,打通企業級Agent從構建、連接、分發到治理的全生命周期。

ADP 4.0要做的,是把這些問題放進一條可管理的生產鏈路裏。

第一步是找場景。

當前,行業內的一個共性問題是,很多企業不是沒有AI預算,而是不知道哪些流程適合做Agent。

ADP 4.0提供50多個場景化模板和行業精選應用,首批上線近40個精選Connector,並支持150多個Skills。企業可以把CRM,ERP,OA,工單,客服,企業網盤,知識庫,文檔系統等已有資源接入Agent,而不是手動搬運數據或重複整理材料。

這降低了企業從零試錯的成本,不管是客服場景的接高頻問題和工單流轉需求,還是營銷Agent商品推薦場景,都有對應的場景和Skill資源支持。

Claw模式則進一步降低了複雜Agent的構建門檻。

在原有LLM+RAG,工作流和Multi-Agent三種構建模式基礎上,ADP 4.0新增支持Agentic Loop機制的Claw模式。創建者無需配置複雜表單,只需要用自然語言描述需求,平台即可自動生成提示詞,掛載知識庫,配置工具並編排工作流。

Claw模式面向更復雜,更長鏈路的業務任務。Agent可以在雲端沙箱中自主編碼運行,調用企業Skills,執行長時任務。創建完成後,可以通過API接口集成到企業業務系統中,也可以通過企業微信,微信等渠道觸達員工和客戶。

騰訊工業質檢平台TI-AOI提供了一個樣本。傳統視覺檢測高度依賴工程師現場經驗,數據檢查,日誌查看,模型判斷和參數調整,往往需要在多個頁面之間切換。

基於Claw模式打造的質檢Agent,可以閉環完成一系列工業流程。工程師只需用自然語言輸入查詢指令,Agent即可自動完成數據健康檢查,訓練可行性判斷,並給出後續優化建議。

第二步是控風險。

一個Agent在進入企業核心流程之前,必須先知道它能做什麼,不能做什麼。

ADP 4.0將治理能力前置到開發源頭。平台支持企業級,空間級,應用級的分層權限架構,並結合RBAC角色權限矩陣,實現功能權限與數據權限隔離。

企業可以根據組織架構,部門,崗位和角色配置訪問範圍,確保不同團隊,不同應用,不同知識庫之間權限邊界清晰。

Skills治理也被納入生產流程。員工提交的自定義Skill需要經過代碼靜態掃描,數據訪問,網絡出站,依賴白名單等安全檢查及多級審批後,才能進入企業專區被調用。Skill不再是個人隨手寫的工具,而是經審批,可共享,可調度的企業資產。

Agent Portal負責跨平台納管。企業可以對不同平台,不同業務場景中的Agent進行集中管理,查看調用量,活躍度,響應質量,運行成本和異常報錯,並定位問題原因。

部署方式也開始決定Agent能不能進入核心數據流。ADP 4.0支持公有云,私有化,混合雲和專有云四種部署模式。智能工作台與安全沙箱的私有化方案,也將支持在客戶內網中安全運行代碼,調用Skills和執行長時任務。

第三步是看結果。

在既有ADP落地中,伊利把導購,下單和營銷做成智能體矩陣。導購智能體上線後,社群商品鏈接點擊率提升15.7%,導購訂單數增長26.02%。智能下單智能體接入語音識別,意圖理解,商品推薦和下單跳轉後,需求識別準確率達到93%,下單轉化率提升39%。

而在酒旅場景下,華住基於騰訊雲智能體開發平台升級「華小AI」,協同搭建38條工作流。住客提出「需要一瓶水」後,系統5秒內完成理解與響應,自動生成工單,並聯動機器人完成配送。

目前,「華小AI」已落地上萬家門店,累計執行近150萬次任務,可自動處理70%以上高頻問詢。酒店服務裏,Agent不再停留在問答,而是進入客需送物,酒店信息,服務設施,周邊查詢,續住開票等住中流程。

在大會上,騰訊雲副總裁,騰訊雲智能體開發平台負責人吳運聲表示,企業級Agent不是比誰更快地搭建,而是比誰能讓Agent穩定,安全,持續地運行在業務現場。

會後採訪環節,字母AI提到,當前不少企業帶着預算和業務場景進入AI建設,但真正落地時,需求往往並不清晰。很多企業知道「要做AI」,卻並不確定哪些流程適合交給Agent,哪些環節真正能產生業務價值。

吳運聲回應稱,企業AI落地正在要求雲廠商「往前走一步」。在他看來,雲廠商不能只停留在模型和平台提供層,而是需要真正深入客戶業務場景。「深入到客戶的業務場景裏面去了解他的業務,再讓業務流程和模型能力更好結合。」

03

瞄準企業生態,進擊的騰訊AI

ADP 4.0真正折射出的,是騰訊AI戰略的一次重心切換——從追求模型打榜,轉向聚焦場景、好用與提效。

過去幾年中,騰訊的AI戰略,更多時候把它放在內部效率和生態的存量優化裏。

2023年,騰訊CEO馬化騰曾在內部談到,AI是幾百年不遇的機會,但騰訊最開始不要急着爭先。

到了2026年股東大會上,馬化騰用「上船」形容騰訊在AI浪潮中的位置,並表示希望「船速能快一點」。

這種變化,很快反映在騰訊AI業務節奏裏。

今年一季度,騰訊營收1964.58億元,按年增長9%。資本開支319.36億元,按年增長16%。騰訊管理層稱,一季度資本開支大部分用於AI相關投入。

若剔除混元,元寶,CodeBuddy,WorkBuddy及QClaw等新AI產品影響,騰訊非國際財務報告準則下經營利潤增速將從9%提高至17%。新AI產品單季影響經營利潤約88億元。

模型側也在同步加速。

混元重構後推出Hy3 preview,主打性價比和實用性,在OpenRouter最新調用量月排行榜中穩居前二。

但對騰訊而言,更大的變化發生在產品和組織層面。

去年,知名AI科學家、前OpenAI研究員姚順雨加入後,騰訊把混元大模型和AI Infra放到更重要的位置。到了這次大會,騰訊討論的重點已經從模型參數轉向產品落地。

在上午的對談中,姚順雨解釋了「AI下半場」的含義。他說,這個概念來自自己去年的一篇博客,「方法論已經變得非常成熟,但尋找問題變得更加困難。」在他看來,預訓練和後訓練讓大模型像一個「萬能錘子」,可以解決各種問題,接下來更重要的是找到好的問題、好的產品和好的環境。

湯道生則把AI時代的產品變化概括成「預製菜」和「開放式服務」的區別。

他表示,PC和移動互聯網時代做產品,更多是產品方預先設計功能,用戶在菜單裏點選;但AI時代,用戶可能用自然語言或語音提出需求,產品方並不知道用戶會問什麼,「所以要充分利用模型能力去理解用戶的需求」,再通過推理和工具調用應對開放式需求。

而要做好AI時代的產品,湯道生認為,核心要具備三種能力。

一是場景聯接能力,通過高頻場景觸點,把大模型嵌到真實業務流。二是工程駕馭能力,通過Harness體系,讓Agent能夠穩定,可信,持續運行。三是模型驅動力,依託模型和產品Co-Design,兼顧實用性,性價比和ROI。

湯道生的觀點,從騰訊雲ADP中,也能窺探一斑:騰訊雲開始把Agent本身當成企業裏的「新軟件層」來做。

在場景連接方面,ADP 4.0 讓Agent不只停留在對話,而是開始調用企業知識庫、CRM、OA、工單系統和MCP工具;還把企業落地經驗,沉澱成50多個行業應用模板,覆蓋金融、文旅、交通、教育、傳媒、零售等典型場景。企業不需要每次都從零開始,只需要一鍵複製模板,配置自己的知識庫、權限和業務工具,就可以快速生成一個可運行的垂直Agent。

在工程駕馭方面,ADP雲端Harness則負責把原本分散在個人端的Agent運行過程,統一納入權限、日誌、成本和安全體系,解決了企業級 Agent 的統一管理、穩定運行、長任務續跑和低成本運營。

在模型驅動方面,企業通過ADP可以使用騰訊混元,也能接入外部模型,平台提供多種模型,供企業根據不同場景需要靈活選擇。

ADP的這套做法和騰訊整體AI方法論形成呼應。這一產品升級也意味着,騰訊正在把過去雲計算時代「應用跑在雲上」的邏輯,進一步推進到「Agent跑在企業系統裏」。ADP承擔的角色,也不只是Agent開發平台,而更像騰訊企業AI的一層運行中間件。

過去,騰訊更多把AI用在廣告推薦,內容生產,遊戲研發等內部場景賦能中。現在,騰訊雲深入到各類企業業務場景的一線中。

毫無疑問,下一階段企業AI的競爭,不會只看誰讓員工多用AI,而會看誰能把Agent接進真實業務流程、守住安全邊界、減少無效調用,最終,觀察Agent運行的結果,能否體現在真實業務產出中。

騰訊雲ADP 4.0想回答的,正是這個問題。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10