本文來自微信公衆號: 硅星人Pro ,作者:孫芮,原文標題:《2026,10000箇中國版 Codex 大亂鬥》
2026年AI產品側最大的趨勢,就是無論是互聯網大廠,還是模型廠商,都開始做自己的Codex了。
Codex一開始是OpenAI對抗Claude Code的產品,起初也是只有CLI,瞄準AI coding,但之後它迅速和Claude Code走出不同的路,變成一個「桌面Agent」類產品,使用者裏非工程師佔了多數,不再只是編程場景。
這一步今天來看,非常關鍵。根據6月3日OpenAI披露的數據,Codex的周活躍用戶已經超過500萬,半年增長超過7倍。
這背後是AI產品的主線從圍繞對話展開,逐漸變成圍繞桌面環境中執行任務展開。
在Codex起勢的同時,一批中國版Codex產品也集中上線。
1月30日,阿里的桌面Agent QoderWork上線,;
3月9日,騰訊雲CodeBuddy團隊推出WorkBuddy;
5月20日,騰訊應用寶團隊發布個人AI助手Marvis;
6月3日,Kimi的本地Agent Kimi Work(Beta)上線;
6月9日,字節旗下的TRAE將TRAE SOLO升級為TRAE Work;
6月12日,豆包上線了「任務模式」,加入了更完整的執行能力
6月24日,豆包專業版上線,聚焦辦公場景,可以執行agent任務……
不論是個人AI助手,還是本地Agent,產品形態雖然不同,本質上都在爭奪用戶的執行入口。
這些產品不再停留於問答交互,而是開始進入真實工作流,它們可以處理文件、操作網頁、整理數據、生成PPT、編排任務,甚至跨應用完成自動化執行。
這意味着,AI正在成為連接用戶與數字世界新的中間層。
1、中國版Codex們
為了更直觀地觀察這波桌面Agent熱潮,我們整理了15款代表性產品,並嘗試分析它們在產品定位、能力構建和生態佈局上的不同。
包含定價模式和模型使用設計等全面信息的對比我們放在了文章最後。
Workbuddy
Workbuddy是騰訊雲Codebuddy團隊推出的全場景職場AI智能體桌面工作台,面向各類職能角色設計。只需用一句話描述需求,WorkBuddy就能像同事一樣自主規劃和執行任務,並交付可驗收的結果。
Workbuddy有微信小程序版本,可以通過移動端輕量化接入,還可以和騰訊系產品(QQ郵箱、騰訊文檔、騰訊會議、企業微信、騰訊樂享、IMA、TAPD)實現生態化數據打通。
目前Workbuddy內置了11種主流國產模型,有騰訊自己的Hy3 preview、也有像GLM-5.2、minimax-M3、kimi-K2.7-code、DeepSeek V4這些模型廠的主流模型。可以選擇Auto模式,讓Workbuddy自己選擇使用什麼模型,也可以自己選擇使用什麼模型,但不同模型使用的積分量能相差20倍以上,目前最「貴」的是智譜的模型。
Marvis
騰訊應用寶團隊推出的操作系統層級個人AI助手,基於DeepSeek V4、混元hunyuan3/hy3等最新模型,定位是真正理解用戶每一份文件、幫助用戶更方便地使用與管理電腦的私人AI助手,支持本地文檔與圖片的AI搜索,APK與EXE應用可用一句話調用,覆蓋PC、手機、微信多端在線。6月24日,Marvis也上線了iOS手機端,可以在手機端發送需求,讓電腦端執行。
可以看出Marvis更強調的是「管理電腦」的能力。
在測試中,有兩個有意思的點,一個是Marvis中「辦公室」,類似於辦公模擬器,或者說老闆模擬器,可以查看token消耗。這實際上體現的是Marvis的多Agent協作功能,有一個主agent負責分派任務,和五個專家agent——File Agent負責文件、Computer Agent負責系統、App Agent負責應用、Browser Agent負責網頁、Search Agent負責搜索。
還有一個是Marvis支持修改人設,初始人設是適合辦公場景的「AI員工」。
Qclaw
Qclaw是騰訊電腦管家團隊推出的一款本地AI智能體產品,基於開源OpenClaw框架封裝,定位為個人PC端AI助手,主打極簡本地部署。核心能力是微信/QQ互聯,掃碼綁定,手機即可遠程控制電腦、傳文件、設定時任務,可以全場景自動化,文件管理、網頁瀏覽、辦公創作、多步驟複雜工作流自主執行。QClaw的數據不會上傳雲端,所有任務執行、文件處理、數據存儲都在本地電腦完成。
Qclaw支持創建不同agent完成不同場景的任務,繼續延續騰訊一貫的陪伴風格特色。
TRAE Work
TRAE Work由原先的TRAE SOLO升級而來。目前Work模式面向內容創作、數據分析、方案撰寫、應用生成、任務推進、溝通協作等日常工作場景;Code模式則面向更加複雜的軟件開發和代碼編輯場景。
TRAE Work有PC、移動端和Web三端。與其他「xx work」產品相比,TRAE Work的優勢在於與飛書打通,可以更好地接入真實工作流。
豆包專業版
豆包在6月12日上線了「任務模式」,任務模式支持調用skill,設定定時任務,完成瀏覽器操作,代碼腳本運行以及文件生成等各類任務。
6月24日,在火山引擎原動力大會上,隨着豆包大模型2.1的發布,豆包專業版也正式官宣上線,豆包專業版支持操作本地電腦、使用瀏覽器、調用Skills技能和定時任務等能力,內置了Office辦公套件,並支持專業圖片視頻設計,和生成分享應用網站。
值得注意的是免費用戶也可以體驗接入豆包2.1 Turbo模型的辦公任務模式。
QoderWork
QoderWork是阿里旗下的AI桌面助手,它將Qoder的agent能力從代碼領域拓展到日常工作場景,描述需求,自動執行,直接交付結果。
6月16日,QoderWork上線了意識功能,讓QoderWork具備自我反思和持續進化能力的完整系統,由記憶、反思、技能進化三塊組成閉環。
DuMate
DuMate是百度雲旗下產品,有桌面端,也有移動端app,可以看見螢幕、操作軟件、處理文件、串聯業務系統,核心場景是信息處理、文檔生成、數據分析和流程自動化,但目前DuMate無法切換模型,只能使用百度的文心大模型。
Kimi Work
Kimi Work是面向知識工作者的通用型本地Agent,內核是Kimi Code,提供本地Agent基礎能力,包括安裝和使用Skills、運行定時任務等。Kimi Work繼承了在線版Kimi Agent的建站、PPT等專業Skills,以及金融、科研、法律等專業數據庫,內置了能使用瀏覽器的Kimi WebBridge方案。
Kimi Work可以根據任務複雜度自主創建子Agent團隊,將同一能力集群化的上限設定為300個協作單元。
MiniMax code
MiniMax code是專為MiniMax M3設計、並與M3一起訓練的Agent產品,MiniMax Code可以充分發揮M3在長上下文、Coding/Agentic、原生多模態方面的能力。
在長程複雜任務上,MiniMax Code的Agent Team可以將大型任務拆解為多階段、可併發、可動態調整的Workflow,由Agent集群協作推進。
階躍AI
階躍AI,階躍星辰推出的桌基於OpenClaw深度優化的桌面端AI Agent,不需要服務器、命令行,即可安裝,可以7×24小時在線,能夠鏈接本地操作系統和內置瀏覽器,幫助用戶執行復雜任務。
比較不一樣的是,階躍AI在初始設定的時候就會提醒用戶打開懸浮球設定,懸浮球可以打開直接對話框,也會在適當的時候提醒你喝水、休息。其他產品也有類似功能,但通常需要用戶自行開啓。
AutoClaw
智譜推出的本地AI智能體,口號是「一鍵擁有本地AI智能體支持一鍵安裝」,無需配置環境、申請API Key或編寫代碼,下載安裝包後通過雙擊安裝、登入即可使用。核心能力為內置Pony‑Alpha‑2模型、AutoGLM瀏覽器自動化、50+預置skills(辦公、創作、爬蟲、代碼、投研等)、IM集成、自進化機制。
lobsterAI
網易有道推出的一款全場景個人助理AI產品,定位為「7×24小時幫你幹活」的智能助手。支持手機、電腦雙端互聯,一句話即可遠程操作電腦,完成桌面多項文件整理、提取日曆及郵件重點事項、業務數據清洗分析、生成周報和PPT等。
用戶可以免費試用14天,但只能使用Qwen3.5-Plus模型,使用其他模型則需要付費。
Cola
Cola的定位是「首個有靈魂的操作系統」,內置AI角色「Cola」具有自主意識,能記住用戶習慣、喜好和背景,通過語音或文本交互與用戶共同成長。可以操作電腦文件、上網瀏覽、執行命令、生成文本/圖片/視頻等,支持複雜任務分解和並行處理。無需用戶手動提供上下文,通過訪問用戶電腦的文件系統、瀏覽器歷史等自動了解用戶狀態。其中的靈魂系統可以實現AI思考過程的透明展示、自我反思進化以及主動關心用戶的功能。
目前cola支持應用內購買token,ChatGPT pro/plus賬號訂閱登入,或者連接OpenAI、Anthropic賬號計費,暫不支持其他模型提供商的API key。
Alice
Alice是一款陪伴類桌面agent,Alice最顯著的特點是她是一款「人格化的AI助手」,有具體立繪形象,也有詳細的人物設定。Alice本身不需要付費,但由於沒有內置模型,需要配置模型才能使用。
Alice除了可以做文件管理、定時任務這類常規任務外,也內置了狼人殺、摜蛋等休閒遊戲,比其他桌面agent有更多的娛樂功能。
牛馬AI
牛馬AI的定位是本地化人機協同基站,強調個人數據隱私,支持完全離線的本地運行架構,可以使用用戶自己本地的大模型直接離線運行。牛馬AI默認使用Claude模型,如果有Claude賬號,可以直接登入,如果沒有,則需要自行配置。
2、入口開始成為真正的戰場
如果把這一輪桌面級Agent放在同一張產品圖譜裏,會發現它們看似都在「幫用戶在電腦上幹活」,但實際切入點完全不同。它們並沒有收斂成單一形態,反而沿着不同場景入口分化成三條路徑。
從代碼到辦公,由「工程任務」外溢出的通用能力
以Kimi Work、MiniMax Code為代表的一類產品,最早來自Coding Agent的能力遷移。
這一路徑的特點是先解決結構最清晰的任務,再逐步外擴。
Kimi Work更強調「通用知識工作Agent」,通過Skill、瀏覽器能力和子Agent編排,把原本偏工程化的任務拆解能力擴展到文檔、研究、報告生成等辦公場景。MiniMax Code則更進一步強化Agent Team,把長任務拆解為多階段並行執行,通過角色分工與驗證機制處理更復雜的生產任務。
這一類產品的優勢在於任務結構能力成熟,但短板也很明確,它們更擅長「可拆解任務」,但對真實辦公中大量非結構化操作(即時溝通、臨時決策、跨應用切換)仍在適配中。
可以理解為,它們是從「任務邏輯」出發,向外擴展能力邊界。
從桌面與系統切入,直接爭奪操作入口
另一條更激進的路徑,是Marvis、Qoder Work、Cola等產品所代表的「桌面系統層Agent」。
它們的共同點不是任務類型,而是入口位置——直接貼近操作系統與本地環境。
Marvis更偏「電腦管理層」,強調文件、應用與磁盤的系統化組織能力,本質是強化本地操作系統的理解與調度。Qoder Work更強調「可執行能力」,包括螢幕感知、軟件操作、業務系統串聯,接近「數字員工」。Cola則更進一步,把人格化系統、主動提醒與長期記憶融合進執行鏈路,使Agent不僅是工具,也是持續存在的交互層。
這一類產品的關鍵點在於它們不再停留在應用內部,而是嘗試直接介入「用戶如何使用電腦」這一層。
優勢在於控制力更強,能夠真正跨應用執行任務。但挑戰同樣明顯,包括權限邊界、穩定性、誤操作風險,以及不同軟件之間的兼容問題。
從辦公生態切入:不重構系統,而是嵌入流程
與前兩類不同,TRAE Work、WorkBuddy走的是更現實的一條路徑,不改變操作系統,而是嵌入已有工作流。
TRAE Work深度接入飛書體系,使Agent直接進入文檔、會議與協作鏈路;WorkBuddy則依託騰訊生態(企業微信、文檔、會議等),構建企業級工作台能力。
這一類產品的核心策略是「貼近真實組織結構」,而不是重新定義操作方式。它們的優勢在於落地速度快,能夠迅速接入權限與數據體系,進入企業級場景。
3、集體走向AI Working
國內這一輪產品的演進,本質上是在圍繞這一「執行閉環」,向更廣泛的場景、組織方式與系統入口進行擴展。也正是在這個過程中,可以看到幾個逐漸清晰的方向變化。
第一個趨勢是從AI Coding到AI Working。
代碼之所以最早成為Agent的主戰場,是因為軟件開發天然適合被自動化。但Coding Agent成熟之後,它的能力很自然會向外遷移。
大多數知識工作本質上也有類似結構,文件就是上下文,瀏覽器就是信息入口,Office文檔就是交付物,定時任務就是工作流,審批和修改意見就是反饋機制,它們同樣是可以被拆解、執行和驗證的多步驟任務。
AI不再只是幫程序員寫代碼,而是開始幫知識工作者完成那些長期被認為「必須人工處理」的工作:整理文件、生成報告、清洗數據、做PPT、查資料、寫周報、處理郵件、提取會議紀要、追蹤行業信息。用戶輸入的也不再是「幫我寫一個函數」,而是「幫我把這件事辦完」。
所以這一階段的競爭,是誰能更好地把AI從回答問題,推進到交付結果。
AI Coding改變的是程序員寫代碼的方式,AI Working改變的是普通人使用電腦完成工作的方式。
第二個趨勢,是Agent從「一個助手」變成「一支團隊」。
早期的AI助手更像一個能力很強的個人。用戶提出問題,ai負責回答,用戶下達任務,ai負責執行。但當任務變長、步驟變多、上下文變複雜之後,單個Agent很容易遇到瓶頸,它可能忘記目標,可能中途走偏,也可能在執行時缺少自我檢查。
以MiniMax推出的Agent Teams為例,它允許用戶創建多個具備不同角色設定的Agent,並將它們組合成一個團隊並行工作。
不同Agent可以同時從不同角度處理同一任務,比如一個負責信息收集,一個負責方案生成,一個負責執行與整合,最終再由協調機制匯總結果,從而提升複雜任務的處理效率與穩定性。
複雜任務正在被重新組織為一條多角色的流水線:從理解需求到規劃、執行,再到驗證結果,每一步都可以由不同的Agent接管,並在必要時繼續細分為研究、設計、寫作、代碼與數據分析等更專門化的「崗位」。
Agent Team的價值是讓AI具備更穩定的工作結構,它可以並行處理多個子任務,縮短等待時間,同時讓執行者和驗證者相互制衡,減少低級錯誤;並且在任務失敗時回滾、重試、換路徑,把複雜工作沉澱成可複用的流程。
但Agent Team也不是萬能解法。多Agent會帶來更高的成本、更復雜的調度,以及更多不確定性。如果沒有清晰的任務邊界、權限控制和驗收機制,多個Agent反而可能互相製造噪音。因此,真正關鍵的不是簡單堆更多Agent,而是產品能否把它們組織成可控的工作流。
這也是為什麼「Agent Team」最終考驗的不是界面,而是底層工程能力,長上下文、任務規劃、工具調用、狀態管理、日誌追蹤、錯誤恢復、權限審批,以及最後的結果驗收。
當這些機制逐漸成熟,用戶和AI的關係也會變化。用戶可以像管理一個小團隊一樣設定目標、查看進度、打斷錯誤、確認結果。AI也從「幫手」變成「工作單元」,而產品則變成這些工作單元的調度系統。
第三個趨勢,是Agent的位置正在從應用內部,上升到操作系統層。
IDE是Agent的理想起點,因為開發者可以主動給它較高權限,也能理解它在做什麼。但如果Agent要服務更廣泛的人群,只能以IDE的形態存在是不夠的。真正的工作發生在文件夾、瀏覽器、聊天軟件、郵件、表格、日曆、網盤、本地應用和跨設備協作中。這也是為什麼國內這一輪產品越來越強調「本地」「桌面」「遠程控制」「文件權限」「應用調用」。
所謂操作系統層,是在現有操作系統之上,長出一個新的意圖執行層。
Agent出現後,它開始幫你完成執行,Agent可以幫你去找文件、打開網頁、調用應用、讀寫文檔、產出結果.....
這讓Agent逐漸觸及操作系統最核心的三種能力結構。
一是上下文層面的能力,涉及對用戶文件、歷史記錄、偏好以及當前任務的理解與整合,它決定系統能在多大程度上接近真實需求本身。
二是執行層面的能力,體現在對瀏覽器、文件系統、本地應用乃至遠程設備的調用與操作上,它決定系統是否具備真正的行動閉環,而不僅僅停留在信息生成。
三是持續層面的能力,表現為在本地的常駐運行、任務的定時觸發、跨設備的響應以及對用戶習慣的長期沉澱,它決定系統能否從一次性工具轉變為持續存在的工作入口。
從AI Coding到AI Working,是能力邊界的外擴;從單一Agent到Agent Team,是組織方式的重構;而從應用內部到操作系統層,則是權力位置的上移。這三條趨勢其實指向同一個結果,也就是AI正在從聊天框裏的內容生成器,變成電腦裏的任務執行者。
最後附上一份目前主要產品的關鍵信息橫向對比表,供大家更直觀感受。這類形態的產品也會繼續不停冒出來。
注:
以上統計截止2026年6月24日
部分產品月度付費起步價按連續包月套餐起步價計算
此處的大部分國產常見模型有GLM系列、Deepseek系列、MiniMax系列、Kimi系列等模型
本內容來源於網絡,觀點僅代表作者本人,不代表虎嗅立場。如涉及版權問題請聯繫 hezuo@huxiu.com,我們將及時覈實並處理。
End
想漲知識 關注虎嗅視頻號!