迄今為止,所有關於Manus的公開討論,幾乎都未觸及核心。就連剛過去的周末,唐傑、楊植麟、林俊暘、姚順雨這四位「基模四傑」圍爐聊天,聊到Manus的意義時也只是避重就輕,一筆帶過。
這事兒有點反常。大概率是因為Manus現在正處在風口浪尖,大家不方便說太深。但放到今天來看,任何一場關於人工智能的討論,要是繞開了Manus,價值都會大打折扣。
維特根斯坦說過:「凡是可以言說的,都可以說清楚。」Manus代表的技術演進方向,正好就是能說清楚的那種——它不是一次普通的技術升級,而是AI應用的「DeepSeek時刻」,標誌着人工智能從「只會生成內容」轉向「能自主完成任務」的範式轉變。
就像當年DeepSeek問世,把開源領域的大模型應用門檻拉低,讓普通人也能用上大模型一樣;Manus的「多智能體系統」,靠大模型和虛擬機的巧妙結合,直接把AI變成了能自己搞定複雜任務的數字生產力。
其實不管是OpenAI、Anthropic,還是國內的DeepSeek、字節跳動,早就等着這麼一個能把「AI應用」說透的時刻了。無論 Manus 如何年少乖張、誤入歧途,但它摸索出的這條AI應用路徑,哪怕只是靈光一現,也配得上「偉大」兩個字。
Manus模式的價值,核心就三點:
1.它是人類歷史上第一家擁有8000萬名以上「員工」的公司;
2.其本質是一套「人工智能操作系統」;
3.它代表的技術模式最終一定會跑通,而這將意味着人類文明實現0.5個級別的躍升。
以上所言,並無虛妄。接下來,AI行業會迎來繼算力之後的又一場「囚徒困境」式戰爭。從各種模型新勢力,到BAT這些大廠,再到Meta、字節、OpenAI,還有Anthropic和DeepSeek,沒人能置身事外。
01
Manus的「8000萬名員工」
Manus對外披露的核心數據裏,大家最關注的往往是它的年度經常性收入(ARR)突破1億美元,還有累計處理了147萬億tokens的龐大規模。但真正能體現它模式核心的,是「創建超過8000萬虛擬計算機實例」這個指標——外界常忽略這點,可這纔是它的關鍵玄機。
拿移動互聯網時代做個對比,就能看清它的顛覆性:
移動互聯網時代,雲計算是操作系統,支撐着數以億計的虛擬機(也就是雲服務器),這些虛擬機都是靠人來操作的。人類精英在這些虛擬機上搭建起電商、社交、短視頻這些萬億級產業;
而Manus模式,是用編程語言當核心調度規則,把Claude、GPT、千問這些第三方先進大模型整合起來,在算力基礎上搭建了8000萬台由AI自主操作的「虛擬機」。每一台虛擬機都是一個獨立的數字工作單元,能做研究、搞開發、處理自動化任務,本質上就相當於8000萬個功能不同的AI員工。
這標誌着核心操作者徹底變了:從人變成了AI。而支撐這種轉變的Manus系統,就是AI的操作系統——多智能體系統。
再往深想,Manus模式意味着人類正在迎來一次「文明級」的生產力飛躍。
首先,所有和數字經濟相關的勞動崗位,都能夠被AI接管,這本身就相當於文明提升了0.5個級別;一旦算力更加充裕,AI員工從8000萬擴展到8000萬億級別(當然其中的系統複雜程度也將不可同日而語),它能迸發的能量會徹底重構現有物理世界的所有生產工具。
到那時候,具身智能體(人形機器人只是其中一種)會在絕大多數領域取代人類,甚至取代現在的自動化設備,那就能帶來一整個級別的文明躍升。
02
AI應用的「DeepSeek時刻」
2024年初,Anthropic發布多智能體系統的研究結果時,一組數據小小地震撼了整個行業:在多智能體架構下,Claude Opus處理複雜任務的性能,比單個智能體提升了90.2%。
這組數據背後藏着一個簡單卻深刻的道理:真正的智能從來都不是孤立存在的。
深度學習興起後,AI發展一直盯着「把單個模型做強」這條路——堆更多參數、用更大的訓練數據、設計更復雜的架構,似乎這是實現AGI的唯一正解。比如GPT-4的參數達到1.8萬億,Gemini Ultra搞了跨模態融合,Claude 3在長上下文理解上有突破。
但現實很殘酷,這條路已經走到頭了,邊際效益越來越低。
多智能體系統走的是另一條路:不追求無所不能的「超級大腦」,而是打造分工明確、能協同工作的「智能社會」。在Manus的架構裏,規劃代理像戰略家,負責讀懂用戶需求、制定行動方案;執行代理像專業工人,各自調用工具完成任務;驗證代理像質檢員,確保每個環節的結果準確。
這種分工帶來的效率提升很驚人。
Anthropic的實驗顯示,處理那些需要並行推進、信息量超出單個模型上下文窗口的任務時,多智能體系統的表現比單智能體好90.2%。更關鍵的是,95%的性能差距都能歸因於三個因素:token使用量(佔80%)、工具調用次數和模型選擇。
也就是說,多智能體靠合理分配任務、調度資源,實現了「1+1>2」的協同效果。
理論上來說,AI發展能分成三個階段:第一階段是感知智能,比如圖像識別、語音識別;第二階段是認知智能,比如理解語言、邏輯推理;現在正進入第三階段——多智能。
多智能的核心不是單個智能體的能力,而是協作能力。人類文明能實現飛躍,就是從個體狩獵變成羣體協作開始的。多智能體系統本質上就是在數字世界裏重演這個進化過程:當多個AI能像人類團隊一樣分工、協作、糾錯、優化時,它們解決複雜問題的能力就會發生質變。
其實之前已經有很多單點突破證明了AI的實力:DeepSeek-Math在數學推理上贏了人類選手,AutoGPT能自己完成複雜項目,Devinci的代碼生成水平接近資深工程師。
而多智能體系統要做的,就是把這些「專家」組織起來,讓它們協同幹活。這不是技術的簡單升級,而是能力的指數級爆發。
在專門評估AI處理現實複雜任務的GAIA基準測試裏,Manus在所有三個難度級別都拿了最好成績,分數超過OpenAI的DeepResearch,成了排名第一的AI助手。要知道,GAIA測試考的都是需要多步驟推理、調用外部工具、長遠規劃的問題,能拿第一說明Manus的能力是實打實的。
商業上的表現更能說明問題。Manus推出不到一年,年度經常性收入(ARR)就突破了1億美元,這個成績遠超大多數SaaS初創公司的同期表現。現在還有250多萬人在排隊等着試用,它的兩個定價檔次——39美元/月的基礎版和199美元/月的專業版——也把商業化路徑走得很清晰。
這背後的邏輯很簡單:當AI能真正代替人類完成從頭到尾的複雜工作,而不只是當個輔助工具時,它的商業價值就從「提升效率」變成了「替代勞動力」。
這標誌着AI應用徹底告別了「玩具」「助手」階段,正式進入「工作者」階段——這就是AI應用的「DeepSeek時刻」。
02
多智能體系統的幾塊技術基石
多智能體系統能有這麼強的能力,不是憑空來的,背後靠的是多重核心技術支撐:虛擬機提供的安全執行環境、算力池化實現的高效資源利用,還有智能編排保障的協同工作流。
這些技術看着基礎,甚至古舊,卻是把多智能體從理論變成靠譜產品的關鍵。
1.虛擬機:AI的「獨立工作車間」
Manus會為每個任務創建獨立的雲端虛擬機沙盒,這個設計解決了AI產業化的核心難題:安全和可靠。
傳統AI應用常遇到「環境不兼容」的問題——生成的代碼換個地方就跑不起來,調用的工具和系統衝突,一個任務出錯還會影響整個系統。虛擬機技術提供了完全隔離的執行環境,讓每個任務都在「乾淨」的環境裏開始和結束,既保證了系統穩定,也能讓結果重複驗證。
更重要的是數據安全。企業用戶最擔心的就是敏感數據在AI處理時泄露或被污染。Manus的虛擬機架構做了四級安全防護:網絡隔離防止數據跨任務流動,任務完成後沙盒直接銷燬,確保沒有數據殘留,訪問權限按「最少夠用」原則分配,每個操作都有審計記錄。
到現在,Manus至少創建了超過8000萬台獨立虛擬機,這個數字不僅體現了它的規模,更證明了這套架構的穩定性和可擴展性。
從雲計算的角度看,這種模式很有顛覆性。」虛擬機是雲服務的核心產品,隨着多智能體應用爆發,它的需求肯定會大幅增長。而更重要的是,中國那些在雲計算時代虛擬機技術上沉澱諸多的公司——百度、阿里、深信服們,將在新的技術競爭周期迎來又一個春天。
2. 池化與編排:聰明的「資源管家」
多智能體系統的另一個核心優勢,是能智能管理資源。Manus用「分層推理」的策略,根據任務難度動態匹配模型:簡單任務用Llama 3這種輕量級開源模型,複雜任務才動用Claude 3.5這種重型模型。這種精細化調度,把單個任務的token消耗降到了行業平均水平的1/3。
池化技術的核心是打破「資源孤島」。傳統AI應用常為每個功能單獨部署模型,導致資源浪費。Manus建了統一的算力池和模型池,能全局調度、動態分配資源。用戶提交複雜任務時,系統不會讓一個超大模型包攬所有事,而是從池子裏調多個合適的模型和工具,讓它們各展所長、協同完成。
智能編排系統就是多智能體的「指揮中樞」,要解決一系列複雜問題:怎麼把大任務拆成小任務?哪些小任務能同時做?哪些必須按順序來?算力不夠時怎麼分配?任務出問題了怎麼處理?
Manus的編排系統靠強化學習不斷優化,分析了數千萬次任務執行數據,持續改進任務拆分和資源分配的算法。
Manus的技術博客裏能看出來,它背後有很強的工程化能力——比如上下文管理、穩定虛擬機環境搭建、外部應用集成這些。這些看似「不核心」的工程問題,恰恰是多智能體系統能否穩定運行的關鍵。
大模型的上下文窗口限制是個大難題,就算最新的模型支持100萬tokens,應對真正複雜的任務還是不夠。Manus用了個巧妙的上下文管理策略,只把必要的信息傳給每個智能體,既保證任務信息完整,又不浪費上下文空間。
中國團隊在工程實現上的優勢很明顯。和硅谷公司側重算法突破不同,中國工程師更擅長把先進技術變成穩定靠譜的產品。Manus的工程能力體現在很多方面:能支持10萬+任務同時運行,複雜工作流能自動重試、找替代方案,響應時間穩定可預測。這些工程細節的打磨,是多智能體從「演示demo」變成「商業產品」的必經之路。
以上邏輯上看,Manus無疑是DeepSeek之後最具突破性的AI公司。
03
下一場「囚徒困境」式AI戰爭
大廠必須跟進的原因,其實就三個維度:
技術上,多智能體是大模型能力的「放大器」。單個大模型再強,處理複雜任務也有侷限,多智能體靠協作能突破這個瓶頸,不跟進的話,自家大模型的應用價值會大打折扣;
產品上,多智能體重新定義了人機交互方式。從「人操作AI」到「AI自主完成任務」,這種轉變會催生出全新的產品形態,錯過這個轉變,可能就像諾基亞錯過智能手機一樣,從領導者變成旁觀者;
生態上,多智能體平台可能成為新的生態中心。就像iOS和Android撐起了移動互聯網生態一樣,多智能體平台可能會成為AI應用的開發、部署和運行基礎,失去這個平台地位,在AI時代就會被邊緣化。
從公開的專利、人員流動和技術路線圖能清楚看到,全球科技巨頭都在加速佈局多智能體:
國外這邊,Meta不僅收購了Scale AI增強數據能力,內部的多智能體團隊已經把Llama系列模型和多智能體框架結合,在內部管理任務中提升了30%的效率——雖然大模型很拉胯,但在認知水平上Meta顯然是被低估的;
Google的Gemini項目本來就包含多智能體協作的思路,還公開了《AGENTS:多智能體語言模型系統開源框架》的核心架構;
微軟通過Azure AI提供多智能體開發工具,還把這能力集成到Office和Dynamic 365裏,想做「企業數字員工平台」;亞馬遜的AWS Bedrock新增了多智能體編排功能,讓企業能基於多種大模型搭建自己的系統。
國內市場也一樣熱鬧:
一年前,阿里千問團隊就被傳出過於Manus存在合作,計劃用打造適合中國市場的Agent系統;騰訊引人姚順雨之後,目標非常明確,直至智能體能力;百度作為強化學習時代的領導者,在「智能體編排平台」技術領域有深厚沉澱,相關多智能體技術專利也已在2025年內曝光;
字節跳動的動向雖顯神祕,但2026年繼續高強度提升算力水平,也在側面折射出其在智能體應用上存在巨大需求——豆包手機或許只是個煙霧彈,正餐大概率會是多智能體。
與此同時,最可被寄以厚望的本土模型新勢力則是月之暗面(Kimi),它早在半年前就已經快速入局多智能體(OkComputer項目)。近期,這家公司完成了5億美元的C輪孖展,由IDG資本領投,估值達到30億美元。這次孖展的主要用途之一,就是「加強多智能體系統的研發和產品化」,目標是一年內實現1億美元的ARR,複製Manus的增長路徑。
如果Kimi這個目標能實現,就證明多智能體的商業模式是可複製的,到時候會有更多創業公司扎進這個領域,競爭會更激烈。
當然最重要的信號還是來自DeepSeek,多智能體系統的根據在於系統化AI編程能力——即AI的通用語言能力,當前全球最強的AI編程模型公司是Anthropic,基於這一能力,Anthropic實則已經超越OpenAI成為全球第一強的大模型公司。而據說春節前後DeepSeek將推出的新版本模型,即對標Anthropic的模型編程能力。一旦如此,中國AI多智能體應用便將少去所有技術上的後顧之憂,中國AI應用的寒武紀便將完全爆發。
04
人類角色歷史性轉變:從操作者到管理者
多智能體系統帶來的一個深刻變化,很容易被低估:編程語言正在變成AI之間的「通用語言」,而人類和AI的關係,正在從「操作者-工具」變成「管理者-團隊」。
觀察Manus的工作過程會發現一個有意思的現象:用戶用自然語言下達指令,但AI之間溝通,卻大量用結構化、精確的「類代碼」語言。規劃代理傳給執行代理的不是模糊的描述,而是包含函數調用、參數設定、條件判斷的「任務說明書」。
這是效率的必然要求。自然語言雖然表達豐富,但容易有歧義,多個AI要精準協作,模糊的指令只會導致錯誤和低效。代碼或類代碼語言能做到無歧義表達,確保每個AI都清楚自己該做什麼、要達到什麼標準。
比如用戶要求「分析公司財報並提取關鍵財務指標」,規劃代理不會直接把這句話轉給執行代理,而是轉換成一系列精確的操作指令。這種代碼化的任務描述,不僅精準,還能驗證、調試、重複使用。這背後是人機協作方式的根本轉變:人類不用再糾結「怎麼幹」,只需要說清楚「幹什麼」就行。
當AI能用代碼級的精度理解和執行創造性任務時,人類創造性勞動的內涵就變了。傳統的「創造性工作」裏,其實藏着很多重複、模式化的內容:市場分析師收集數據、設計師調整佈局、程序員調試代碼、律師查閱案例。這些工作雖然需要專業知識,但本質上是常規執行。
多智能體系統能自動化的,正是這部分「創造性工作裏的執行環節」。短期內,它們不會取代人類的戰略判斷、審美選擇和價值取向,但能把人類從繁瑣的執行裏解放出來。
這會帶來兩個結果:一是初級、中級創造性工作的需求可能減少;二是高階創造性工作的價值會被放大。比如AI能完成80%的常規設計任務,人類設計師就能專注於那20%需要突破性創意的部分;AI能寫標準法律文件,人類律師就能更專注於複雜案件的策略和法庭辯論。
這不是職業消失,而是職業進化。就像計算機沒消滅會計師,只是把他們從手工記賬裏解放出來,變成了財務分析師和戰略顧問一樣,多智能體也會重塑每一個知識型職業。
生產力的飛躍一定會帶動生產關係的調整。多智能體帶來的不只是效率提升,還有組織方式的根本變革。
傳統企業的層級結構,是圍繞人類的能力限制設計的:需要管理層定戰略、中層傳指令、基層執行,因為信息傳遞和處理能力有限。而多智能體能瞬間完成從戰略解析到任務執行的全過程,企業的層級會變得越來越扁平。
更深刻的變革,在於生產資料所有權的重新定義。工業時代的核心生產資料是機器,信息時代是數據和算法,到了多智能體時代,「智能體團隊」本身就成了核心生產資料。企業不用再僱佣大量人類員工組成團隊,而是可以「租用」或「培養」AI智能體團隊。
這種轉變已經開始了。Manus的定價模式,本質上就是「數字勞動力租賃服務」:39美元/月能同時運行2個任務,199美元/月能同時運行5個任務。對中小企業來說,這意味着不用僱全職團隊就能獲得專業能力;對大企業來說,就能靈活調整「數字員工」規模,應對業務波動。
而生產關係變革裏,最大的挑戰可能是分配問題——當AI創造了大量價值,這些價值該如何在企業、用戶和社會之間分配,目前還沒有明確的答案。
05
被低估的風險:數據主權與系統安全
多智能體系統高歌猛進的背後,有兩個核心要素被嚴重低估:數據和安全。它們就像數字世界的暗物質,看不見卻支撐着整個系統,一旦出問題,可能從基石變成致命弱點。
傳統AI裏,數據主要是訓練模型的「原料」——越多越好、越多樣越好。Meta花143億美元收購Scale AI 49%的股份,就是這個思路:靠高質量、大規模的標註數據提升模型性能。但在多智能體系統裏,數據的角色徹底變了。
在這裏,數據不只是訓練原料,還是AI之間協作的「流通貨幣」,更是系統進化的「記憶載體」。每個任務執行過程中,規劃代理的任務分解策略、執行代理的工具調用經驗、驗證代理的錯誤總結,都會以數據形式沉澱下來,變成系統的集體智慧。
Manus據稱通過聯邦學習建的「經驗庫」,已經積累了2000多個行業任務模板和千萬級的任務執行記錄。這些不是原始訓練數據,而是結構化、可複用的「工作記憶」。遇到相似任務時,系統不用從頭推理,直接調用優化過的方案,效率最高能提升60%。
這種轉變帶來了新問題:數據的產權和價值分配變模糊了。用戶的任務需求、系統生成的執行策略,到底屬於誰?用這些數據優化系統、服務其他用戶時,怎麼保障原用戶的權益?行業現在還沒形成共識,但這是多智能體商業化必須解決的根本問題。
還有個隱性風險是數據質量的「馬太效應」:優質用戶(能提出清晰複雜需求的專家)產生的數據質量高,能讓系統在相關領域越變越好,進而吸引更多優質用戶,形成正向循環;而低質量數據會讓系統在某些場景下停滯甚至退化。這種分化可能加劇數字鴻溝,讓多智能體變成少數人的「特權工具」。
單智能體的安全問題主要是「輸入輸出安全」,比如防止惡意提示、輸出有害內容;但多智能體的安全挑戰要複雜得多,涉及流程安全、協作安全和進化安全三個層面。
流程安全是多智能體特有的問題。一個任務拆成多個子任務讓不同AI並行執行時,可能出現意想不到的風險。比如財務分析任務裏,「數據收集AI」不小心爬取了敏感信息,「報告生成AI」又把這些信息寫進了最終報告,導致數據泄露。單獨看每個AI的行為都沒問題,但組合起來就出了安全漏洞。
Manus的虛擬機沙盒能提供基礎隔離,但解決不了AI之間的語義級安全問題。所以它加了「安全驗證代理」,專門監控任務執行中的數據流和權限使用。但這會增加系統複雜度和成本——測試顯示,完全的安全監控會讓任務執行時間增加15%-30%。
協作安全更微妙。AI之間要通過通信協調工作,這個通信通道可能被攻擊者利用,搞「AI間攻擊」。比如攻擊者通過惡意提示控制了「文件管理AI」,再讓它給「數據發送AI」發僞造指令,把敏感數據傳出去。這種兩個授權AI之間的「合法」通信,傳統安全防護很難檢測。
進化安全是最棘手的挑戰。多智能體系統能通過學習不斷優化,但如果學習數據裏混了惡意信息或異常模式,系統可能會「學壞」。更危險的是,這種「學壞」是漸進的、難察覺的,不會突然作惡,而是慢慢在邊緣場景出現偏差,最後在某個臨界點爆發問題。
Anthropic的研究顯示,多智能體的安全風險和AI數量呈非線性增長:從單智能體漲到三智能體,已知攻擊路徑增加5倍;漲到五智能體,攻擊路徑增加23倍。這種複雜度的爆炸式增長,讓傳統的安全審計幾乎失效。
數據和安全在多智能體系統裏是「不可分割的共同體」:更多優質數據能提升系統能力,但也會擴大攻擊面;更強的安全措施能保障可靠,但會限制數據流動和系統靈活性。
現在行業在探索差分隱私、同態加密、可信執行環境這些技術解決方案。Manus的企業版就有「隱私計算模塊」,能讓敏感數據在加密狀態下被處理,AI只能拿到結果,看不到原始數據。但這會犧牲性能——加密狀態下的計算速度可能下降40%-60%。
更深層的問題,是安全與效率的根本權衡。絕對安全的系統可能效率極低,高效的系統又可能存在安全漏洞。多智能體需要在兩者之間找動態平衡點,而這個平衡點會隨應用場景、數據類型、風險承受能力變化。
以上,這不僅是技術問題,更是治理和倫理問題。
06
多智能體的發展路徑已不可逆
Manus的八千萬台虛擬機,不是冰冷的數字,而是一個新型生產力時代的信號。每一台虛擬機都是一個潛在的「數字員工」,它們不知疲倦、可以無限複製、能瞬間協同,正在重新定義「工作」本身。
多智能體系統的成熟,標誌着AI從「替代人類特定技能」進入了「替代完整工作流」的階段。但這種替代不是「機器取代人」的零和遊戲,而是生產力關係的範式轉移。
歷史有過類似的啓示:ATM機的出現沒消滅銀行櫃員,反而改變了他們的工作性質。1985到2005年,美國ATM機從10萬台漲到40萬台,銀行櫃員數量卻增加了10%。變化的是工作內容——櫃員從處理現金交易,變成了提供金融服務和解決問題的顧問。
多智能體時代也會重演這種轉變。當AI能處理常規的流程化創造性工作時,人類的角色會向三個方向進化:任務設計者(定義AI要解決的問題)、過程監督者(確保AI工作符合要求)、價值判斷者(做需要倫理考量、審美選擇和戰略權衡的決策)。
站在現在往前看,多智能體系統的發展路徑已經很清晰了:
短期1-2年,垂直領域的多智能體應用會爆發。金融、法律、醫療、教育等行業的專業Agent會大量出現,它們不是通用AI的簡化版,而是針對特定領域深度優化的專家系統。Manus的商業模式會被複制和改造,市場競爭會異常激烈。
中期3-5年,多智能體系統會從「工具」進化成「平台」。就像iOS和Android撐起了移動應用生態一樣,領先的多智能體架構會成為AI應用的基礎設施。
長期5-10年,人機協作會進入「融合」階段。人類和AI的界限會變得模糊,不是靠腦機接口這種科幻技術,而是靠工作流程的深度整合。人類決策會融入AI的實時分析,AI執行會吸納人類的即時反饋。到時候,工作不再是「人做的」或「機器做的」,而是人機系統共同完成的。
Manus的八千萬虛擬員工,本質上是人類協作智慧的數字鏡像。人類文明的進步,從來不是靠個體智能的飛躍,而是靠協作方式的革新——語言、文字、印刷術、互聯網,每一次媒介革命都擴大了協作的規模和效率。
多智能體系統是這一進程的再一次里程碑式延伸。它第一次讓機器具備了真正的協作能力——不是簡單的任務並行,而是基於共同目標、分工協調、相互糾錯的有機協作。當機器學會協作,它們帶來的不只是效率提升,更是全新的可能性。
但這種可能性也伴隨着深刻挑戰。當AI能自主協作完成複雜任務時,傳統的責任框架、監管模式、倫理準則都需要重新思考:誰為多智能體的集體決策負責?怎麼確保它們的協作符合人類價值觀?如何在享受協作紅利的同時防範系統性風險?
這些問題沒有簡單答案,但它們定義了多智能體時代的核心議程。Manus和它的八千萬虛擬員工只是序幕,真正的故事才啱啱開始。在這場人類文明的歷史性重構中,技術是推動力,但人類的智慧、倫理和遠見,纔是決定方向的終極力量。