为什么龙虾首先出现在电脑,而不是手机?|AI 器物志

爱范儿
Yesterday

编者按:

智能手机统治了过去十几年的数字生态,它是注意力的黑洞,是我们最私密的随身之物。但手机从设计之初就是为“人盯着它”而生的——它的全部逻辑,都止于屏幕。

AI 的需求却恰恰相反:它需要持续感知物理世界——见你所见,听你所闻,随时在场,而非等你解锁屏幕才醒来。

当 AI 真正成为一种基础能力,它迟早要从屏幕里破壳而出,寻找属于它自己的形状。这将是一个漫长的探索和演化过程。

“AI 器物志”栏目由此而来,爱范儿想和你一起持续观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

这是“AI 器物志”的第 7 篇文章。

没想到,在这个人人都在找下一个 AI 硬件的新时代,作为“旧时代”终端的电脑,却成为了今年开年最强势的 AI 载体。

原因无他——“龙虾”OpenClaw 更适合部署于电脑之中。

一时间,作为 OpenClaw 最佳容器的 Mac mini,成了这段时间最抢手的科技单品。全世界的开发者和极客,都争相想在上面部署一个自己的 AI 智能体,即使作用还不大,也想体验一把 AI 助理自动化办事的未来交互。

那么问题来了,为什么 AI 新时代来临之际,反而是电脑这个“旧时代”的终端成为了排头兵,而不是被寄予变革厚望,且人手一台的手机?

电脑保留着“机器交互”的底层逻辑

道理其实很简单:比起一开始就为“人类交互”而生的手机,电脑一直保留着“机器交互”的底层逻辑。

还记得吗?在鼠标指针、图标、按钮出现之前,电脑只有“字符”,也就是所谓的“命令行”,黑底白字,闪烁的光标,因此只有少数能用“计算机语言”的人,才能驾驭这台机器。

随着多用户操作系统的出现、硬盘容量的提升等种种技术发展,计算机系统也需要相应做出调整,Unix 带来了树状目录结构的文件系统,时至今日仍在影响现代计算机。

而出于降低门槛、推广计算机的考量,图形界面最终应运而生,成为了现在我们手上的计算机系统的模样。

但值得注意的是,即使发展了数十年,图形化的 OS,依旧保留了“命令行”这一种交互方式,文件存储系统也成为了计算机使用、运行的根基,这和智能手机是相当不同的。

▲ macOS 的“终端”

电脑,或者说“计算机”,一开始就是作为“生产工具”诞生的,完整的文件存储系统对于生产力来说不可或缺,而不少专深的开发工作都需要用到命令行。用户得到计算机后,要自己配置、选取甚至开发所需要的工具和生产环境,因此“机器交互”得以保留。

21 世纪才出现的智能手机,整个交互逻辑直接“跳级”到了图形界面,设计目标是让操作尽可能简单、直观、零门槛。

可以说,今时今日的电脑和手机,都是面向终端用户的消费产品。但手机是更纯粹的消费产品,电脑则仍然保留了生产力工具,特别是作为开发工具的身份。

为了保证易用性,同时照顾开发者利益,手机上的 App 被设计成封闭、即装即用的模式。虽然 App 之间仍然可以通过 API 接口互通,但本质上每个应用都是独立且功能完整的小岛。

这也导致手机的生产任务,一定程度被“框”在了 App 围栏之中,很难实现电脑那样高效。

如果说,即使图形化的计算机系统,也保留了初期“命令行”和接口等各种“机器交互”的方式,那么智能手机在最初设计时,就只为最符合直觉的“人类交互”而来。

更重要的是,电脑的高度可定制和可编排性虽然强大,也为病毒、黑客、恶意脚本埋下祸根。

智能手机则相反,它必须在安全和隐私上极尽收紧,核心权限被封锁,系统严格管理应用的操作空间。

为什么电脑不会被手机“杀死”,为什么 iPad 始终取代不了 Mac,原因也在于此。

▲ 大号手机 vs 正经电脑,图源:Tom's Guide

这样截然不同的两种模式运作了十几年,本来没有遇到什么问题,直到 AI 时代的到来。

你很难想象,从 App Store 下载一个 App,能够实现根据给出的指令,自动帮你接外卖电话、看日程安排、购物买东西,因为手机应用的权限和能力几乎仅限于应用内部。

所以才会有“豆包手机助手”这种方案,用多模态图形识别能力,让机器去模仿“人类交互”,实现 App 操作自动化,其实本质上是一种“曲线救国”——即使如此,很快也遭到了应用方面的铁腕封禁。

▲ 豆包手机助手帮我在各个 App 种草、比价洗发水

但在 AI 诞生之前,人类已经可以写脚本控制浏览器,可以用 Python 操作 Excel,可以用命令行管理服务器,只是曾经我们必须要用“机器的语言和方式”来完成这些操作。

OpenClaw,以及各种设计用途各异但底层大体相同的 agent,就像翻译官,接收人类自然语言的指令,将其转化为机器的语言,和电脑进行交互。

▲ 图源:腾讯科技

并且比起性能相对有限、后台机制严格的手机,电脑在算力、上下文、续航上都更有显著优势。

最关键的问题是,作为“消费载体”的手机,真的需要一个全自动的 AI 助手,帮我们提高“效率”吗?

当 AI 智能体真的要开始为我们干活时,它也会更倾向于站在,离“生产工具”更近的电脑一侧。

保留了老派“机器交互”方式的电脑,就这样在 AI 新时代下,反超以“人类交互”为核心的手机,成为了 AI 工作流变革最有希望的起始点。

当图形界面退居二线,电脑会成为什么?

从 OpenClaw 身上,我们又一次真切地看到一种可能:那些层层叠叠、彼此割裂的窗口,终有一天会被收归到一个对话框里。

我们使用电脑的方式,将迎来结构性改变。

相信对于大部分人而言,现在使用 AI 的方式,仅仅停留在让它作为一个窗口随时待命,让它帮忙写作、搜索、整理,本质上只是一个孤立的辅助工具。

OpenClaw 则预示了第二个阶段:我们适当放手,对于一些更复杂的工作,也可以只下达指令,让 AI 执行一切,交付结果。

用编辑的工作举例,以往我们写早报周报,免不了要往返于各大媒体收集新闻源,收集新闻的过程必须手动完成,才能交给 AI 进行整理和写作。

以后,只需要在对话框中输入一句“帮我整理今天的科技独家写一个汇总”,智能体可以完成所有工作——它自动从新闻源抓新闻,然后再自动整理写作,我们只需要最后验收结果,这样的工作流甚至可以彻底自动化。

人类使用电脑的方式从来不是一成不变的。今天很多人部署“龙虾”在一台 Mac mini上,自己却未必坐在它面前。反而更常见的画面是:在手机上的 Telegram、飞书里对着一个机器人发一句话,让它去那台电脑上跑脚本、抓信息、生成文件,再把结果回传回来。

这其实很像一种新时代的 SSH。执行发生在那台机器上,但控制界面可以漂浮在任何地方。区别只是,过去我们用命令行把指令敲进去,现在我们把意图写成一句自然语言,再由智能体把它翻译成命令、API 调用与文件操作。

这几年,电脑厂商都在卷“AIPC”,但卷的方向还停留在第一个阶段,即出厂预装一个“AI 助手”的应用,只能简单辅助用户一些简单的文字工作。

如何把类似 OpenClaw 的能力,直接集成到系统底层,让消费者不需要复杂配置,也不需要担心安全问题,开箱就能指挥 AI 智能体帮忙快速完成任务,这才是厂商们下个阶段应该去捣鼓的“AIPC”。

早在 1982 年,人机交互领域的先驱 Bill Buxton 就在论文中提到,“自然用户界面”应该遵循的原则:“简单性高于一切”,应该利用人类在现实世界中已有的技能,减少认知负担。

回看计算机的普及史,也正是连完全不懂编程语言的普罗大众,也能轻易上手可视化的表格软件界面,比手动计算更高效地完成财务报表,本质上也是将复杂的能力进行简化。

▲ 电子表格程序 VisiCalc 成功将向大众推广了电脑

而千百年来,人类都在用语言交流,这就是门槛最低的交互方式。

所以,五十年后的电脑,我们是不是就再也看不到图标、窗口、按钮,只剩下一个对话框,就像当年 DOS 电脑的命令行界面?

我认为不尽然,图形界面还会被保留,以方便人类直接上手微调、审核、最终控制,只是最重要的还是那个和 AI 交流的“框”。

▲ 未来用 AI 修图的方式

经过这样改造之后的“电脑”,似乎已经不再需要大屏幕、键盘和鼠标,在性能足够的条件下,完全可以成为我们手掌上的一个屏幕。

等等,这不就是手机吗?

是,但又和我们现在的手机很不同,这让我不禁去想,似乎我们现在的移动终端,走在了一条弯路上。

这条我们曾经以为是未来,还正在带来便利创造价值的弯路,名字叫“App”。

结果付费时代,人类的价值在于“方向感”

在 OpenClaw 大火之后,AdobeSalesforce 等软件商巨头都遭到冲击,股价大跌。

▲ 今年 2 月,软件股受到 OpenClaw 冲击

乍一看好像有点奇怪,为什么一个免费的开源项目,能威胁到这些商业模式成熟的软件商?

Adobe 和微软,他们卖的是“工具”,而 AI 厂商,直接卖“结果”。

OpenClaw 预示了一个新时代的到来:以后,想要剪视频、修图片,我们不需要再去购买订阅什么剪映和 Photoshop,把钱留着买 token 给 AI 使用,为结果而不是工具本身付费。

说到底,Photoshop、Office 这些应用,都是给人类设计的,未来我们需要的是给“机器”设计的软件,这无疑是对软件业的一次彻底颠覆。

随着大部分的交互、操作,都被一个 AI 的对话框代替,生产流程将变成一个“黑箱”——我们下达需求,直接获得结果。

未来,我们学习的将是如何定义目标、拆解任务、设定边界条件,以及如何校正 AI 的输出。

至于中间 AI 调用了哪些接口、拆解了多少步骤、组合了哪些工具,用了什么模型,并不重要。对绝大多数人来说,过程将被折叠、隐藏、自动完成。

人类的生产方式,将从“操作界面”转向“表达意图”,以及“验收成果”。

当 AI 编程能力真正成熟之后,可能都不需要“软件”,AI 响应用户需求后,直接生成需要的工具和流程完成交互。

这会是一个相当长期的过程,在当下,依旧阻力重重:国内的“豆包手机”遭到 App 方面的顽强抵抗,而国外像 Meta、LinkedIn 等平台,也在明确封禁任何自动化操作。

争抢“入口”这回事,一直是互联网和技术发展绕不开的一个节点。作为一个正在发生的技术,手握 Android 的 Google 也已经选择了“自动化”的道路,一切都是大势所趋。

未来,不兼容 AI Agent 的服务、平台和终端,会逐渐失去存在感;强势的工作流会倒逼软件开放接口、重构逻辑,甚至重做商业模式。谁不能被调度,谁就会被绕开。

▲ Google Gemini 自动化任务处理,图源:9To5Google

谈论了这么多“机器做事”以及“机器生产”,我们作为人类的价值,又会走向何方呢?

恰恰在那些无法完全被“计算”的地方——眼光、判断、观点、问题意识。AI 可以执行复杂流程,可以完成非人之事,但它没有感情,没有灵感,更无法替代人类对“做什么”以及“为什么做”的思考。

我也相信,对于人类来说,“创造力”更接近一种本能,这是任何 AI 都无法取代的。

Anthropic 公司联合创始人 Daniela Amodei,在《华尔街日报》的一个访谈中,也表达了她对人类创造力的期待:

关于人类创造力,有两种截然不同的观点。一种观点认为:人工智能在所有方面都会超越我们,到时候没人愿意再做任何事了。那将是多么糟糕。

但我是一个乐观主义者,所以我倾向于第二种观点,即人类天生就渴望创造意义和创造事物,仅仅因为他们享受创造的过程。

文|苏伟鸿

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10