文 | 市值榜,作者 | 相青,編輯 | 趙元
2022 年 11 月,ChatGPT 上線。兩個月後,它的月活用戶突破 1 億,成為互聯網歷史上增長最快的消費級應用之一。
很多人當時認為,這只是一次搜索方式和內容生產方式的升級。但如今回頭看,這場技術浪潮真正改變的,很可能是互聯網本身的運行邏輯。
過去三年,AI 行業已經經歷了三個明顯階段:模型時代、應用時代,以及正在到來的操作系統時代。
如果說 ChatGPT 代表了大模型的入口,那麼最近爆火的 OpenClaw,則讓人們看到了讓 AI 從「回答問題的工具」,變成「替人做事的操作系統」的希望。
當 AI 能夠調用工具、訪問文件、操作軟件、甚至主動執行任務都變得安全可靠時,未來計算機系統的結構也可能隨之改變。
一個類似 PC 時代 Windows、移動互聯網時代 iOS/Android 的AI 操作系統,正在逐漸形成。
一、不完美的啓蒙者
與傳統 AI 聊天工具不同,OpenClaw可以直接操作電腦、調用軟件並執行任務,這是它能夠爆火的關鍵因素。
必須正視的是,當前的OpenClaw遠非一款成熟、易用的產品,甚至存在諸多明顯短板。它的部署門檻較高,運行過程也並不絲滑,還面臨着權限安全、隱私泄露、Token消耗過快等現實風險,這些問題都讓它難以迅速成為大多數普通人的生產工具。
但這款「不完美」的產品,核心價值在於完成了一次關鍵的行業啓蒙與認知突破——讓更多人第一次直觀感受到,AI 不僅能「動口」給出答案,還能「動手」完成任務。
隨着OpenClaw的爆火,國內科技公司紛紛通過接入「龍蝦」,開啓AI入口之戰。
除了Kimi等大模型公司接入OpenClaw ,最令人關注的是騰訊與字節等大廠的動作。
在AI領域推進相對謹慎的騰訊,這一次動作異常密集,一連發布5個龍蝦產品,包括桌面AI智能體WorkBuddy、接入企業微信的OpenClaw、接入QQ的OpenClaw、騰訊雲輕量雲部署OpenClaw,以及騰訊電腦管家推出的QClaw。
更關鍵的是,其中已有產品可以關聯QQ和微信。比如,安裝QClaw後,就能直接在微信和龍蝦對話,讓它幫你幹活。以後,當你休息時突然被領導安排一個工作,你直接在微信發一句話,就能讓電腦幫你完成任務,包括改表格、發郵件、操作瀏覽器流程等,再也不用被打斷休息了。
騰訊還在推進微信內部的官方智能體。
據The Information報道,騰訊正為微信打造一款新型AI Agent,該Agent將連接微信內運行的數百萬個提供各類服務的小程序,涵蓋從預約出租車到訂購雜貨等衆多領域,以在競爭中超越阿里和字節跳動等對手。報道稱,該項目被列為高優先級機密計劃,擬於今年年中啓動灰盒測試,三季度正式推出。
字節跳動、百度等也在做類似的佈局。
火山引擎正式上線ArkClaw,據官方介紹,這是一款開箱即用的雲上SaaS版OpenClaw。無需任何複雜配置,打開網頁即可使用7×24小時在線的AI 助手,輕鬆養「蝦」。
百度也推出了手機應用「紅手指Operator」,將OpenClaw能力延伸至移動端,支持用戶通過自然語言指令實現跨App任務自動化,實現打車、外賣訂餐等跨App的交互操作。
這些公司動作為何如此迅速?
核心原因在於, AI 正經歷從生產力工具向系統級入口的質變。與早期的聊天式 AI 不同,新一代 AI 智能體可以調用軟件、操作設備並自動完成複雜任務。
如果說移動互聯網時代的入口是 App ,那麼在 AI 時代,入口很可能變成 AI 智能體。而這場AI時代的操作系統之爭已經在全球範圍內打響。
一方面,AI 公司正在強化 AI 的系統能力。
OpenAI 正在持續擴展 ChatGPT 的工具調用、任務執行和開發者接口,使 AI 可以直接連接各種軟件服務。
最近,OpenAI推出的GPT-5.4,引入了原生計算機使用功能,使人工智能代理能夠通過鼠標、鍵盤和視覺輸入與操作系統、網站和應用程序進行交互,開發人員可以使用該模型在各種軟件環境中自動執行多步驟工作流程。
同時,傳統科技巨頭正進行底層防禦。
微軟正在將 AI 深度嵌入 Windows 與 Office 體系,希望讓 AI 成為新的操作入口;蘋果則在 iPhone 與 macOS 中強化本地 AI 能力,試圖將 AI 融入系統底層。
當 AI 能夠調用應用、操作設備並執行復雜任務時,一種新的計算架構正在形成,用戶 → AI → 應用服務,圍繞這一入口的競爭,本質上是一場新的操作系統入口之爭。
二、下一輪AI競爭,拼的是行為數據
OpenClaw 的爆火,讓 Agent 在短時間內成為 AI 行業最熱的方向之一。但對科技公司來說,這場競賽與當下 AI 產業的現實壓力有着莫大關係。
過去幾年,大模型訓練主要依賴互聯網公開文本,例如百科、新聞、書籍或論壇內容。但隨着模型規模不斷擴大,這些數據的價值正在下降。
已有研究指出,人工智能對數據的需求增長速度遠遠超過了真實且多樣化的數據來源所能提供的速度,缺乏自然產生的真實數據,正使人工智能的發展面臨嚴重風險。
研究機構 Epoch AI 曾在2024年發布的一項研究預測,科技公司將在十年(大約在 2026 年至 2032 年之間)耗盡人工智能語言模型可用的公開訓練數據。
短期來看,像 OpenAI 和谷歌這樣的科技公司正在競相獲取高質量的數據源,有時甚至為此付費,以訓練其人工智能大型語言模型,例如,通過簽署協議來獲取 Reddit 論壇和新聞媒體源源不斷的句子。
從長遠來看,新的博客、新聞文章和社交媒體評論將不足以維持人工智能目前的開發軌跡,這將迫使企業利用現在被視為私人的敏感數據(例如電子郵件或短信),或者依賴聊天機器人自己輸出的不太可靠的「合成數據」。
而下一階段模型能力提升的關鍵,不只是更多文本,而是更接近真實行為的數據。
當用戶讓 AI 完成一個任務時,AI 會經歷一系列具體步驟,比如搜索信息、打開網頁、調用軟件或填寫表單。這些操作會形成完整的任務鏈路,也就是業內常說的任務軌跡數據。
與靜態文本相比,這類數據更接近真實世界中的行動邏輯,對訓練具備執行能力的 AI 模型具有更高價值。從這個角度看,科技公司大規模推廣 Agent,也是為了搶先爭奪下一輪競爭的數據源,訓練自己的模型。
當越來越多用戶通過 Agent 完成任務時,這些操作過程本身也會形成大量新的訓練數據。
在使用 Agent 的過程中,用戶往往需要不斷給出指令、糾正錯誤、調整任務步驟。對於 AI 系統來說,這些交互過程實際上構成了一種高質量的強化學習數據。每一次任務執行、每一次修正,都在記錄 AI 如何逐步完成複雜任務的完整軌跡。
一旦這些數據被匯總到雲端,它們就可能成為訓練下一代 Agent 模型的重要資源。
相比傳統互聯網文本,這類數據不僅包含語言信息,還包含任務拆解、工具調用和決策路徑,對於提升模型的推理能力和執行能力具有更高價值。
三、AI正進入「1995 時刻」?
如果將時間線拉回到30年前,1995 年的互聯網正處於混沌期。
彼時 TCP/IP 協議已成熟,但大部分企業仍然在摸索互聯網究竟能做什麼,普通人進入互聯網也需面對枯燥的指令。
直到 Windows 95 的出現,它通過圖形化界面有效地封裝了底層技術的複雜性,並通過標準化的 API 接口為開發者搭建了低門檻的創作環境。
這一改變,不僅讓「聯網」從極客行為轉化為普通人點擊圖標的日常,更促成了 PC 軟件生態的爆發,開啓了互聯網普及的黃金十年。
30年後的今天,AI 產業似乎也站在一個類似的「1995 時刻」。
大模型已展現出處理各種複雜任務的能力,比如可以寫報告、生成視頻、編寫代碼、分析數據、以及操作電腦、調用軟件並執行任務,幾乎無所不能。
但在實際使用中,普通用戶仍然需要學習複雜的提示詞,在不同網頁和應用之間來回切換,尋找合適的模型或 Agent 完成任務。
換句話說,AI 的能力已經足夠,但缺乏一個能將各種AI能力轉化為系統效率的組織中樞。
以此來看,Windows 95 是 PC 時代的操作系統入口,那麼 AI 時代也急需自己的「操作系統」。它將成為連接用戶、Agent 和應用服務的統一中樞,包括理解用戶意圖、拆解任務、調度工具、生成結果,用戶只需提出需求,其餘由系統自動完成。
過去幾十年,從 PC 時代的 Windows,到移動互聯網時代的 iOS 與 Android,應用始終是網絡世界的基本單位。用戶使用手機或者電腦的過程一直是,打開應用,再在應用內部完成各種操作。
但在 AI 操作系統的架構下,這一邏輯可能發生變化。
當 AI 能夠理解用戶需求、調用工具並自動完成任務時,用戶不再需要自己打開多個應用,而是只需要告訴 AI 想完成什麼事情。AI 會在後台自動調用不同服務,並將最終結果返回給用戶。
這種模式下,計算機系統的結構將變成:用戶 → AI → 應用服務。
這意味着,AI 時代,計算機可能進入一種新的交互模式,即意圖驅動:用戶不再需要學習軟件如何使用,而只需要表達自己的意圖;計算機系統的任務,則是理解意圖,並自動調用各種工具完成任務。
那麼,這樣的 AI 操作系統會以何種形態出現?目前行業正處於多路徑演進的交匯點。
一種可能是新的硬件入口。OpenAI已經請了初代 iPhone 的設計師艾維參與研發首款人工智能消費產品,希望他能複製自己在設計蘋果iPod、iPhone和iPad等最具標誌性產品時所取得的成功。
據外媒報道,這款產品被定位為「第三核心設備」,可以放在口袋裏,也可以和MacBook Pro、iPhone一起放在辦公桌上。而且這款設備將小巧便攜,能夠感知周圍環境和生活情境,並且完全沒有螢幕。
另一種可能是在超級應用之上建立 AI 入口。如騰訊、阿里等平台型公司,都在嘗試通過 AI 將現有的應用生態重新整合,讓用戶通過一個入口調用各種服務能力。
無論何種形態,如果這一模式真正成熟,那麼 AI可能成為PC和移動互聯網之後,下一代計算平台的核心基礎設施,而在這種新架構下,今天以 App 為核心的流量分發體系,也可能被重新改寫,真正的商業權力將從「應用流量」轉移至「意圖分發權」。