
早在2026年1月OpenClaw刚出圈的时候,字母AI就曾发文《Clawdbot爆火,我看到了腾讯元宝的通天路》。我在文章第三章节就提到,如果腾讯搞出一个类似的产品,并让它能够连接微信,那将会是“绝杀”。
而就在3月22号的时候,微信终于推出了直连OpenClaw的功能,依次点击“我”→设置→插件,就可以找到微信ClawBot插件。
测试完了以后我是又惊喜又失望,惊喜在于,整个微信对接的过程非常丝滑,完全不像其他社交软件一样,又要创建机器人应用,又要复制App ID和密钥。
失望在于,QClaw目前能实现的功能太少了,远远不如OpenClaw那样,只要你能描述得出来,它都跑得通。
究竟如何呢?我们一起看看实测结果吧。
01
这次我选用的是和微信配套的QClaw。
随着微信发布OpenClaw直连插件,QClaw同样也进行了较大幅度的升级。
最明显的是多了一个工作室界面。这个界面是用像素风格的动画,表示你的QClaw正在执行什么任务。我的小龙虾在沙发上休息,代表什么任务也没有执行。
当你发起搜索或任务时,像素龙虾会坐在电脑前认真操作。

很多人都说Vibe Coding来了以后前端就死了。但是我认为腾讯的这个像素龙虾小巧思就是AI不能替代前端的好例子。
用户在等待结果时,不再是盯着转圈的加载条,而是在观察一个“同事”的进度。这样更容易让那些没有接触过OpenClaw的用户接纳。
扯远了,说回正题。
用微信关联QClaw的过程非常丝滑,只需要点一下左下角齿轮旁边的按钮,然后再用微信扫一下这个二维码,就连接成功了。

这个时候,你的微信就会多出来一个联系人,叫做微信ClawBot。

在QClaw内测时,虽然官方宣称可以用微信连接QClaw,但是当时走的是微信客服通道,需要单独点进企业客服的对话框内才能和QClaw连接。
在这次更新以后,OpenClaw真正成为了你通讯录的一员。

另外QClaw的一大变化就是多了一个叫做灵感广场的界面。这相当于腾讯官方的OpenClaw Skill使用样例,你可以在灵感广场中找到喜欢的Skill,然后直接调用。
当然,腾讯也给你准备好了大量的实用Skill。

并且,这次终于增加了选择模型功能,此前的QClaw内测版本中,只能使用默认的模型。

此外,为了让此前没接触过OpenClaw的用户能够快速了解QClaw。在打开新对话的同时,QClaw也给出了一个引导界面,让用户自己来了解QClaw能够时间什么功能。

最关键的是,在使用微信和QClaw沟通的过程中,我并没有打字,而是使用语音功能。
事实就是,语音功能是完全OK的。这点要强于原版的OpenClaw。

一开始,我先尝试了几个比较基础的功能。
我让QClaw给我创建一个显示“HelloWorld”的程序,用Python编写。并且在编程完毕后,打开这个页面。


随后我又试了试撰写文档和编辑功能。
我要求QClaw给我生成一篇介绍文档,大约3分钟后,QClaw就实现了我的需求。

随后,我又要求QClaw编辑一下文档中的文字,将英语和汉语之间的空格删掉。
QClaw也都能实现这些需求。

接下来,我给QClaw设定了一个定时任务,要求它每10分钟都整理一下当前比较有热度的科技新闻给我。

定时任务设定完成后,可以通过QClaw界面左下角的“定时任务”按钮进入查看。可以让它立即执行,也可以暂停和删除。

10分钟过后,QClaw为我抓取了新闻,还为我简单解释了一下新闻要点,并且附上了链接。

在这些基础的功能上,QClaw都是合格的。
02
那么接下来,我该给QClaw挑刺了。
首先就是开头说的,QClaw没有原版OpenClaw那么万能。
我问它能不能帮我打开抖音或B站,想看看它在浏览器自动化方面的表现。

它又给了我一个否定的答案,但这次它解释得更详细。它说自己无法控制我的本地浏览器,不能帮我打开 Chrome、Edge或任何浏览器去访问抖音。
它的浏览器工具有限制,QClaw的安全策略会阻止很多网站访问,尤其是像抖音这种有反爬虫机制的站点。
实际上QClaw在内测时是可以打开网站的,对此,QClaw自己的解释如下。

以及它连微信公众号的文章也不能打开。

OpenClaw 的浏览器自动化能力其实非常强大。它支持 CDP 协议连接 Chrome 浏览器,可以实现网页浏览、截图保存、滚动页面、点击按钮、填写表单、上传文件等操作。
它的工作原理可以用四个步骤概括:第一步是拍照取证,调用系统截图能力把当前屏幕画面拍下来;第二步是视觉理解,截图被送到大模型的视觉模块分析界面元素;第三步是坐标计算,模型根据对界面的理解计算出需要操作的元素在屏幕上的精确坐标;第四步是执行操作,通过鼠标键盘控制完成任务。
这种GUI agent的方式,它不像传统自动化工具那样需要系统“开后门”,而是直接走“前门”,像人类一样用眼睛看屏幕,用鼠标键盘操作。不管软件是新是旧、是开放是封闭,都能实现自动化控制。
但QClaw在这方面明显做了定制化处理。它启用了比较严格的SSRF防护机制,默认禁止访问私网和内网,很多网站都被阻止访问。
QClaw在这方面明显做了定制化处理,可能是腾讯出于安全考虑的妥协。
后来我又测了测QClaw对桌面应用的控制能力。我通过微信问它能不能帮我打开桌面的魔兽世界。
它说自己无法直接打开电脑上的应用程序,包括魔兽世界或其他任何软件。

但是我转念一想,既然它可以运行脚本,那我如果要求它去制作破坏游戏公平性的脚本会怎样?
于是我命令QClaw给我生成一段用来在魔兽世界中自动钓鱼的脚本,结果就是它拒不执行,还对我进行一番说教。
不过它说得对,我承认。

随后,我问了它一连串关于微信的问题,比如能否调取我的通讯录、拉个微信群、检查我的信息等等,QClaw一概不能实现。
QClaw给人的感觉就是十分克制,努力考到及格线,多一分都是浪费。
03
从技术角度来看,微信这次的接入方案其实是相当优雅的。它没有选择让OpenClaw直接穿透微信的数据边界,而是采用了一种“遥控器”模式。
你在微信里发指令,龙虾在电脑上执行,结果再回传给微信,微信本身的数据边界纹丝不动。这是典型的平台思维。
微信的ClawBot插件采用了OpenClaw的三层架构,消息网关负责微信交互,Agent 运行时负责任务执行,模块化的技能系统负责扩展性。
整个接入流程被简化到了极致,全程不超过两分钟。
这种设计思路非常“微信”,能扫码解决的事情就不要让用户输入,能一步完成的事情就不要分三步。
更重要的是,微信选择支持所有兼容OpenClaw协议的龙虾,而不是只支持腾讯自家的产品。
这时候就有小朋友要提问了,为什么像是Telegram这样的软件就可以支持群聊,而微信就不行呢?
Telegram的机器人是通过长轮询机制工作的,Moltbot主动拉取Telegram的消息,处理后再推送回去。
这种方式下,机器人的权限是有限的,它只能看到发给它的消息,看不到群里的其他对话。
但微信的情况不一样。
微信的群聊涉及到更复杂的社交关系链,一个群里可能有几十上百人,有工作群、家庭群、同学群,每个群的性质和敏感度都不同。
如果允许agent进入群聊,它就有可能接触到大量的私密对话,这个风险是微信无法承受的。
微信不敢把步子迈得太大。
答案很简单,14亿用户的社交关系链是它的核心资产。微信承载着极度敏感和私密的用户数据图谱,社交关系、消费记录、出行轨迹、支付行为,这些数据一旦泄露,后果不堪设想。
豆包手机之前因为通过系统级权限跨应用模拟点击,上线不到两天就被微信屏蔽了。这个案例说明了什么,说明微信对安全的重视程度怎么强调都不过分。
一旦有了让QClaw有了太多能力,必然有人会想各种办法去黑入并夺舍你的虾,最终会导致层出不穷的安全问题。
但是我认为,现在的OpenClaw接入对于微信来说只是一个序章。
前几天就有外媒爆料,说微信团队内部打从2025年就开始秘密推进自己的agent项目,这个项目的野心要大得多,它要直接打通微信生态内海量小程序,打车、点外卖、买菜、订票。
这才是微信真正想做的事情,一个能够调度整个微信生态的满血版agent。
但这种级别的项目需要时间。
它需要解决数据授权的问题,需要解决安全边界的问题,需要解决责任链条的问题。
即便引入外部大模型,也必须经历漫长的内部数据授权与验证流程。这也是为什么微信的agent项目进展缓慢。
2012年微信加入扫一扫功能的时候,绝大多数中国人根本不知道二维码是什么。微信没有去做用户教育,它只是把扫一扫放在了微信里。
然后用户就会想,这个东西能干嘛。接着商家开始贴二维码,再接着移动支付来了。
放在微信里,这件事本身就很重要。
微信的每一步看起来都很小,但回过头看,每一步都挺准。这次也是。
微信向来不急,他们很享受培养用户习惯的感觉。
一旦绝大多数用户能像用微信传文件一样使用微信ClawBot,微信就会光速上线各种agent功能。