谁来管住失控的token?

字母榜
Jun 09

今年以来,Token经济概念火爆全球。但在刚刚过去的5月底,亚马逊却选择关闭内部AI使用榜单“KiroRank”。

这个榜单原本统计员工在Kiro开发平台上的Token消耗。然而,榜单启用后,一些员工让AI执行无意义任务,只为把使用量刷高。

亚马逊高级副总裁Dave Treadwell随后提醒员工,不要为了使用AI而使用AI。外媒报道称,亚马逊已经把考核重点从原始Token消耗转向“标准化部署”,也就是工程师用AI实际交付了多少可用结果。

企业AI第一轮热潮里,管理层最常问的是员工有没有用AI,部门有没有接入AI,业务有没有做Agent。KiroRank关闭后,第一批大规模应用AI的企业,开始面对另一个问题:AI用量被推高以后,谁能证明它带来了业务结果?

本月初,一个新词开始在美国企业AI圈层流行:AI sticker shock(AI账单震惊)。

按量计费的AI产品进入企业后,企业用户发现支出账单变得难以预测。Agent进入企业后,又面临海量Token消耗带来的成本攀升。

于是,一个问题被反复提及:企业真正需要的Agent平台,究竟应该是什么样?

这个由Agent生态引发的系统性问题,正在等待新一代企业级AI平台作答。

01

失控的Token

亚马逊关闭内部AI榜单“KiroRank”背后,是企业大量应用AI后,Token反而“失控”的现实。

亚马逊原本希望用榜单鼓励工程师使用Kiro开发平台,但结果是一些员工让AI执行无意义任务,把使用量刷高。

这是企业AI落地后的第一重困境:用量会失真。员工用了多少AI,部门建了多少Agent,都可以出现在汇报文档上。但企业真正关心的是,项目有没有推进,Agent做出了多少产出,人工链路有没有被缩短。

瑞典金融科技公司Klarna也在客服场景遇到了相似困境。

2024年,Klarna曾对外称,AI客服承担了相当于700名全职客服的工作。一年后,公司开始重新招聘人工客服。Klarna CEO Siemiatkowski承认,过度转向AI影响了服务质量。

Klarna前后两次动作,让行业开始重新审视:AI节省下来的成本,如果换来更多复核成本,就不能称得上是靠谱的生产力。

在组织管理侧,企业大规模引入AI后的资源配置问题也开始显现。

澳大利亚联邦银行CEO Matt Comyn在近期谈到,企业把AI用于更复杂任务后,相关成本会变得更难预测。他还批评低价值AI产出正在增加,用“work slop”(AI工作垃圾)形容那些看似完成工作,实际价值有限的内容。

换言之,AI消耗了很多Token,组织未必获得更多结果。

这也是一些咨询机构调低Agent项目预期的原因。

国际研究与咨询机构高德纳(Gartner)预计,到2027年底,超过40%的Agentic AI项目会因为成本上升、业务价值不清或风险控制不足被取消。Agent项目能否持续,不只取决于模型能力,也取决于企业能否把它放进真正的生产流程。

成本和效率之外,Agent进入企业生产流程后,还会把安全问题推到台前。

本月初,Meta一款用于Instagram账号支持的AI客服机器人,被安全研究人员发现存在漏洞。攻击者通过设计特殊话术诱导AI执行错误操作,最终获得多个高影响力账号的控制权限,其中包括奥巴马白宫账号,丝芙兰等知名品牌账号。

当Agent开始连接企业系统后,这类错误操作可能在更长链路中引发连锁反应。它不只是回答错一句话,而可能错误修改账号信息,触发业务操作,或者访问本不该访问的数据。

成本同样是绕不开的一环。

此前,一篇新加坡南洋理工团队的研究提到,在工具调用链场景下,Agent可能被引导进入极长调用链,实验中单次查询成本最高被放大658倍,能耗提升100到560倍。随着Agent接入MCP,插件和企业内部系统,传统按Token计费开始面临新的挑战。

企业今天面对的,已经不是简单的“接入AI”问题,而是如何让Agent真正实现有效产出。

“AI下半场更难的是寻找好问题,好场景和好环境。”

在近日举行的2026腾讯云AI产业应用大会上,腾讯首席AI科学家、腾讯混元大语言模型及AI Infra负责人姚顺雨这样说道。

行业高速变迁下,模型能做的事情越来越多,但企业仍要回答,什么才是值得被Agent解决的问题。

02

可靠的Agent,才能进入系统层

“今天AI原生服务的推理成本仍然较高,用户提交的任务复杂度不同,成本消耗差异也很大。”在会后的采访环节,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,把问题拉回企业AI落地本身。

这也解释了为什么企业级Agent面临的“痛点”。当Agent真正进入生产流程后,企业更关心的是三件事:哪些业务场景值得做,Agent接入系统后能不能被安全管理,最后有没有形成可核算的业务结果。

会上,腾讯云智能体开发平台4.0的推出,让这一话题再度引发讨论。它瞄准的正是Agent进入企业生产环节后面对的这些问题,定位为企业级AgentOps平台,打通企业级Agent从构建、连接、分发到治理的全生命周期。

ADP 4.0要做的,是把这些问题放进一条可管理的生产链路里。

第一步是找场景。

当前,行业内的一个共性问题是,很多企业不是没有AI预算,而是不知道哪些流程适合做Agent。

ADP 4.0提供50多个场景化模板和行业精选应用,首批上线近40个精选Connector,并支持150多个Skills。企业可以把CRM,ERP,OA,工单,客服,企业网盘,知识库,文档系统等已有资源接入Agent,而不是手动搬运数据或重复整理材料。

这降低了企业从零试错的成本,不管是客服场景的接高频问题和工单流转需求,还是营销Agent商品推荐场景,都有对应的场景和Skill资源支持。

Claw模式则进一步降低了复杂Agent的构建门槛。

在原有LLM+RAG,工作流和Multi-Agent三种构建模式基础上,ADP 4.0新增支持Agentic Loop机制的Claw模式。创建者无需配置复杂表单,只需要用自然语言描述需求,平台即可自动生成提示词,挂载知识库,配置工具并编排工作流。

Claw模式面向更复杂,更长链路的业务任务。Agent可以在云端沙箱中自主编码运行,调用企业Skills,执行长时任务。创建完成后,可以通过API接口集成到企业业务系统中,也可以通过企业微信,微信等渠道触达员工和客户。

腾讯工业质检平台TI-AOI提供了一个样本。传统视觉检测高度依赖工程师现场经验,数据检查,日志查看,模型判断和参数调整,往往需要在多个页面之间切换。

基于Claw模式打造的质检Agent,可以闭环完成一系列工业流程。工程师只需用自然语言输入查询指令,Agent即可自动完成数据健康检查,训练可行性判断,并给出后续优化建议。

第二步是控风险。

一个Agent在进入企业核心流程之前,必须先知道它能做什么,不能做什么。

ADP 4.0将治理能力前置到开发源头。平台支持企业级,空间级,应用级的分层权限架构,并结合RBAC角色权限矩阵,实现功能权限与数据权限隔离。

企业可以根据组织架构,部门,岗位和角色配置访问范围,确保不同团队,不同应用,不同知识库之间权限边界清晰。

Skills治理也被纳入生产流程。员工提交的自定义Skill需要经过代码静态扫描,数据访问,网络出站,依赖白名单等安全检查及多级审批后,才能进入企业专区被调用。Skill不再是个人随手写的工具,而是经审批,可共享,可调度的企业资产。

Agent Portal负责跨平台纳管。企业可以对不同平台,不同业务场景中的Agent进行集中管理,查看调用量,活跃度,响应质量,运行成本和异常报错,并定位问题原因。

部署方式也开始决定Agent能不能进入核心数据流。ADP 4.0支持公有云,私有化,混合云和专有云四种部署模式。智能工作台与安全沙箱的私有化方案,也将支持在客户内网中安全运行代码,调用Skills和执行长时任务。

第三步是看结果。

在既有ADP落地中,伊利把导购,下单和营销做成智能体矩阵。导购智能体上线后,社群商品链接点击率提升15.7%,导购订单数增长26.02%。智能下单智能体接入语音识别,意图理解,商品推荐和下单跳转后,需求识别准确率达到93%,下单转化率提升39%。

而在酒旅场景下,华住基于腾讯云智能体开发平台升级“华小AI”,协同搭建38条工作流。住客提出“需要一瓶水”后,系统5秒内完成理解与响应,自动生成工单,并联动机器人完成配送。

目前,“华小AI”已落地上万家门店,累计执行近150万次任务,可自动处理70%以上高频问询。酒店服务里,Agent不再停留在问答,而是进入客需送物,酒店信息,服务设施,周边查询,续住开票等住中流程。

在大会上,腾讯云副总裁,腾讯云智能体开发平台负责人吴运声表示,企业级Agent不是比谁更快地搭建,而是比谁能让Agent稳定,安全,持续地运行在业务现场。

会后采访环节,字母AI提到,当前不少企业带着预算和业务场景进入AI建设,但真正落地时,需求往往并不清晰。很多企业知道“要做AI”,却并不确定哪些流程适合交给Agent,哪些环节真正能产生业务价值。

吴运声回应称,企业AI落地正在要求云厂商“往前走一步”。在他看来,云厂商不能只停留在模型和平台提供层,而是需要真正深入客户业务场景。“深入到客户的业务场景里面去了解他的业务,再让业务流程和模型能力更好结合。”

03

瞄准企业生态,进击的腾讯AI

ADP 4.0真正折射出的,是腾讯AI战略的一次重心切换——从追求模型打榜,转向聚焦场景、好用与提效。

过去几年中,腾讯的AI战略,更多时候把它放在内部效率和生态的存量优化里。

2023年,腾讯CEO马化腾曾在内部谈到,AI是几百年不遇的机会,但腾讯最开始不要急着争先。

到了2026年股东大会上,马化腾用“上船”形容腾讯在AI浪潮中的位置,并表示希望“船速能快一点”。

这种变化,很快反映在腾讯AI业务节奏里。

今年一季度,腾讯营收1964.58亿元,同比增长9%。资本开支319.36亿元,同比增长16%。腾讯管理层称,一季度资本开支大部分用于AI相关投入。

若剔除混元,元宝,CodeBuddy,WorkBuddy及QClaw等新AI产品影响,腾讯非国际财务报告准则下经营利润增速将从9%提高至17%。新AI产品单季影响经营利润约88亿元。

模型侧也在同步加速。

混元重构后推出Hy3 preview,主打性价比和实用性,在OpenRouter最新调用量月榜单中稳居前二。

但对腾讯而言,更大的变化发生在产品和组织层面。

去年,知名AI科学家、前OpenAI研究员姚顺雨加入后,腾讯把混元大模型和AI Infra放到更重要的位置。到了这次大会,腾讯讨论的重点已经从模型参数转向产品落地。

在上午的对谈中,姚顺雨解释了“AI下半场”的含义。他说,这个概念来自自己去年的一篇博客,“方法论已经变得非常成熟,但寻找问题变得更加困难。”在他看来,预训练和后训练让大模型像一个“万能锤子”,可以解决各种问题,接下来更重要的是找到好的问题、好的产品和好的环境。

汤道生则把AI时代的产品变化概括成“预制菜”和“开放式服务”的区别。

他表示,PC和移动互联网时代做产品,更多是产品方预先设计功能,用户在菜单里点选;但AI时代,用户可能用自然语言或语音提出需求,产品方并不知道用户会问什么,“所以要充分利用模型能力去理解用户的需求”,再通过推理和工具调用应对开放式需求。

而要做好AI时代的产品,汤道生认为,核心要具备三种能力。

一是场景联接能力,通过高频场景触点,把大模型嵌到真实业务流。二是工程驾驭能力,通过Harness体系,让Agent能够稳定,可信,持续运行。三是模型驱动力,依托模型和产品Co-Design,兼顾实用性,性价比和ROI。

汤道生的观点,从腾讯云ADP中,也能窥探一斑:腾讯云开始把Agent本身当成企业里的“新软件层”来做。

在场景连接方面,ADP 4.0 让Agent不只停留在对话,而是开始调用企业知识库、CRM、OA、工单系统和MCP工具;还把企业落地经验,沉淀成50多个行业应用模板,覆盖金融、文旅、交通、教育、传媒、零售等典型场景。企业不需要每次都从零开始,只需要一键复制模板,配置自己的知识库、权限和业务工具,就可以快速生成一个可运行的垂直Agent。

在工程驾驭方面,ADP云端Harness则负责把原本分散在个人端的Agent运行过程,统一纳入权限、日志、成本和安全体系,解决了企业级 Agent 的统一管理、稳定运行、长任务续跑和低成本运营。

在模型驱动方面,企业通过ADP可以使用腾讯混元,也能接入外部模型,平台提供多种模型,供企业根据不同场景需要灵活选择。

ADP的这套做法和腾讯整体AI方法论形成呼应。这一产品升级也意味着,腾讯正在把过去云计算时代“应用跑在云上”的逻辑,进一步推进到“Agent跑在企业系统里”。ADP承担的角色,也不只是Agent开发平台,而更像腾讯企业AI的一层运行中间件。

过去,腾讯更多把AI用在广告推荐,内容生产,游戏研发等内部场景赋能中。现在,腾讯云深入到各类企业业务场景的一线中。

毫无疑问,下一阶段企业AI的竞争,不会只看谁让员工多用AI,而会看谁能把Agent接进真实业务流程、守住安全边界、减少无效调用,最终,观察Agent运行的结果,能否体现在真实业务产出中。

腾讯云ADP 4.0想回答的,正是这个问题。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10