"龙虾"开门之后,企业AI智能体落地的平衡点,藏在L3的"围栏"里

美通社
Apr 11

IBM咨询2026深耕者系列谈】将邀请IBM咨询的各行业领军者,不只谈观点,更传递一线实干经验,分享在行业变革中解决最为复杂难题的真功夫。深耕者,是懂技术、能实战,与企业一道在场、并肩成长的同行伙伴。

北京2026年4月11日 /美通社/ -- OpenClaw("龙虾")火了。

2026年初,DeepSeek的余温尚未散去,龙虾的火辣开场又席卷全球。这一次,AI不再只是"更会聊天",而是展示了一种全新的可能性:你给它一个目标,它自己想办法完成——自己规划路径、选择工具、处理异常,不用你一步步指挥。"让AI自己干活",一夜之间成了企业AI讨论里最热的叙事。

兴奋之余,一个更现实的问题浮出水面。对于需要处理采购订单、审批流程、客户承诺的企业来说,"AI自己干活"听上去诱人,但紧接着的追问是:它干错了怎么办?它碰了不该碰的数据怎么办?它做了一个涉及资金的决定但没人审批怎么办?

自主到什么程度才是对的?边界画在哪里?这恐怕是龙虾热潮留给每一家企业最值得认真回答的问题。围绕这一话题,IBM大中华区AI咨询服务总经理叶剑技术总监陆子睿,分别从业务判断和技术实现两个维度,阐述IBM的观点。

叶剑从"为什么是L3"以及"围栏该画在哪里"的角度出发——这是战略层的选择;陆子睿则回答了"技术上如何让AI懂业务"以及"如何给智能体加上缰绳"——这是工程层的落地。两者合在一起,才构成企业从"想明白"到"做得到"的完整路径。


叶剑 IBM大中华区 AI 咨询服务总经理

做L3,不急L4!

龙虾很好,它打开了一扇门。但企业今天真正要解决的问题,不是"AI能不能自己干",而是"它懂不懂你在干什么"。自主是手段,融入业务才是目的。

这个判断来自IBM自身的实践。我们在内部推行"零号客户"计划,先拿自己当试验田——在HR、财务、销售、供应链等九个业务领域做了115个AI应用,一年省下来45亿美元运营成本。做下来最大的体会是:AI的价值不取决于它多自主,取决于它嵌入业务有多深、被管理得有多好。

要讨论"自主到什么程度合适"?目前,大家为AI的发展定义了L1到L4的能力分级——从聊天、推理、执行任务,到成为一个创新者。L1和L2比较好理解——L1就是固定流程里加上AI做内容识别,比如自动提取发票信息;L2是AI帮你在预设的几条路里选一条走,比如客服工单自动分流。这两级大多数企业已经在做了,确定性强,风险可控。

真正要讨论的是L3和L4的区别

L4是龙虾所代表的方向:你给它一个目标——比如"优化下季度华东区供应链成本"——它自己去拉数据、分析问题、拟方案、协调执行。没有预设的路径,没有预设的边界。这个能力是真实的,也是令人振奋的。

但L4当然值得关注,今天大多数企业先别急着追那个终局。我们做了不少项目,发现真正卡住落地的,往往不是AI的自主能力不够,而是企业本身还没准备好让AI这么自主。我更建议企业聚焦L3——有限自主。

L3是什么?AI可以自己规划怎么完成一个任务——比如做一次采购决策辅助,它自己去查供应商、比价格、评估交期风险、写推荐报告——但到了"下单"这一步,必须由采购经理点头。再比如设备维修排程,AI可以根据运行数据和备件库存自己排方案,但涉及停机,得交给生产主管决定。

可以把L3想象成:给AI一个足够大的操场,让它自己跑,但围栏的位置是你定的。哪些工具能用、每次最多做几步、什么级别的动作必须等人审——这些围栏画清楚了,AI的自主性才真正可用。

AI不懂你的生意,给它再多自主权也没用

很多企业第一反应是先看模型大小、看Agent框架,但我们做下来发现,真正卡住落地的往往不是这个。这里举两个场景:

第一个是供应链。一家零部件供应商着了火,你需要AI能马上告诉你:哪些原料受影响、哪几条产线的排产要调、哪些客户的交付承诺兑现不了、该启动哪一级应急响应。这些判断的前提是什么?是AI知道"供应商"、"原料"、"产线"、"排产计划"、"客户订单"之间的关系。它不知道这些关系,就算给它最强的模型,它也只能给你一堆泛泛而谈的建议。

第二个是财务。一家矿业企业做损益分析,利润波动了,原因是什么?要沿着"矿种→矿山→产量→国际大宗商品价格→汇率"一路往下追,每一层的关系都要对。大模型什么都能聊两句,但它不知道"铜矿"的产量跟"LME铜价"跟"澳元汇率"之间到底怎么联动。

AI进流程,这是入场券,能体现价值。但AI要真正发挥价值,它得懂你的业务。龙虾让"自主规划"不再是瓶颈了,但"懂业务"和"嵌入流程"才是企业AI落地的胜负手。

围栏怎么建,L4什么时候能做?

围栏画在哪里?我认为有四条线。

第一条是权限。AI能调哪些工具、能碰哪些数据,有白名单。每次任务最多做几步,有上限。超了就自动停下来等人介入。

第二条是角色。这不是弹一个确认框那么简单。在企业里,什么人能批什么事是有规矩的——操作员能确认的事、经理能确认的事、风控能确认的事,层级分明。AI的审批流也得照着这套规矩来,本质上就是把企业原有的授权体系延伸到了AI执行层。

第三条是可追溯。AI每一步用了什么工具、看了什么数据、做了什么判断,都得有记录。不是出了事再去补日志,而是执行过程中就实时留痕。

第四条是评估。不能只看准确率。任务完成了没有、中间退回了几次、出了多少异常、每次任务到底帮公司省了钱还是添了麻烦——这些要有数。没有这套评估,就不知道L3这个围栏该缩还是该扩。

L4什么时候能做?不是幻想,但有硬前提。管理制度和审批流程得全面数字化;核心业务流程得面向AI重新设计过;企业内部的各种业务系统得能被AI调用。说白了,只有企业内部的业务变得"全面可计算"——流程是数字化的、服务是API化的、数据接口是标准的、工作流是可编排的——L4才有基础。否则放一个L4级别的智能体进去,它连内部审批该找谁都不知道。

IBM商业价值研究院的数据也佐证了这一点:79%的高管预期AI到2030年能显著贡献收入,但只有24%说得清楚钱从哪来。这个落差不是技术问题,是路径问题。

2026年是一个分水岭。企业要从做Demo变成真正运营AI。三件事需要一起干:

  • 把业务对象和规则建出来,让AI懂你的生意;
  • 把治理体系搭起来,让L3的围栏第一天就立住;
  • 把AI运营能力建起来,别光追求跑通一次,要能持续、稳定地跑下去。

L3不是L4的将就。它是今天企业AI最扎实的立足点。把L3做透了,同时一步步推动业务的"全面可计算",L4自然水到渠成,别反过来。


陆子睿 IBM大中华区 AI 咨询服务技术总监

让AI懂业务:把隐性的业务逻辑变成机器可推理的结构

当前多数企业AI项目的技术路径是接入RAG、调优Prompt、选择模型,但往往忽略了一个前置问题:AI并不天然理解一家企业的业务逻辑。供应商供应哪些物料、物料适配哪些产线、每个供应商的资质认证状态、不同订单类型的交付承诺周期、一张工单从创建到完工要经过哪些状态节点和审批角色——这些信息分散在ERP、MES、SRM等多个系统中,大量以隐性知识的形态存在于业务专家的经验里。

企业需要做的,是把这些隐性的业务对象、关系和约束规则,转化为一套机器可查询、可推理的结构化模型。业界通常称之为业务本体或领域模型。它的作用,类似于数字孪生之于物理世界——不是复制一个业务系统,而是为AI构建一层可计算的业务语义层,使智能体在规划和执行时能够基于真实的业务关系做推理,而不是基于语言模式做猜测。

企业级智能体平台需要补齐的管控能力

企业对智能体的治理,除了关注它生成的内容是否准确可靠,更要关注它的行为链条——调用了哪些工具、访问了哪些数据、在什么节点做出了什么决策、最终触发了哪些业务动作。当智能体开始执行业务操作而非仅仅回答问题时,行为链条的管控就成为治理的核心。龙虾类框架的推理循环和工具调用能力已经相当成熟,但其设计假设是单用户、无权限边界、无审计要求。企业需要在这个能力内核之上,补齐一层完整的运营管控机制:

第一,技能注册与权限矩阵。智能体可调用的每一个工具在平台上注册并标注风险等级,同时建立角色-工具权限矩阵,与企业现有的组织授权体系对齐,确保不同岗位的AI助手拥有差异化的工具访问范围。

第二,动作门控与步数预算。每次任务设定动作步数上限以防止无限循环。按动作影响程度分级管控:只读查询自动放行,涉及资金、客户承诺或合规判断的高影响动作,根据动作类型和金额阈值动态路由至企业审批链中对应的审批节点。

第三,结构化推理日志。区别于普通文本日志,每一步执行记录包含工具调用、参数传递、返回结果以及AI选择下一步的推理依据,支持全链路回放和定位。同时,这些日志可供评估流水线消费——统计各环节耗时、异常率和通过率——为智能体的持续优化提供量化依据。

第四,熔断与降级。当出现外部接口超时、返回格式异常或连续推理逻辑矛盾时,系统自动暂停任务、保存执行现场并通知运营人员介入。在个人场景中AI出错影响有限,但在企业场景中,异常状态下的继续执行可能直接触发错误的业务操作。

技能注册、权限矩阵、动作门控、推理日志、熔断降级——我们把这套能力统称为智能体的Harness工程,即给智能体加上"缰绳"的系统性工程。它不是限制AI的能力,而是让AI的能力在企业环境中可控地释放。这是企业级智能体平台与个人Agent框架之间的本质差异。

写在最后

龙虾打开了一扇门,让我们看到了AI智能体自主规划、自主执行的巨大潜力。但对于企业而言,穿过这扇门之后面对的不是一条直道,而是一个需要边界感的新世界

叶剑和陆子睿两位专家从不同角度给出了同一个判断:企业AI智能体的规模化落地,关键不在于追求最高级别的自主性,而在于找到自主能力与业务管控之间的平衡点。L3——有限自主——正是这个平衡点所在。在L3的围栏内,让AI充分发挥自主规划的价值;在围栏之外,保持企业对关键决策的控制权。同时,持续投入业务语义建模和智能体Harness工程建设,为最终走向L4积累条件。

在一个AI能力日新月异的时代,比追新更重要的,或许是想清楚一个问题:什么该交给AI,什么必须留在人手里。画好这条线,企业才能真正放开手脚。

媒体联络人李波 IBM中国 


IBM_LOGO_1

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10