來源:源達
投資要點
AI Agent 是AI 發展的第三階段
根據OpenAI對AI發展的理解和定義,AI水平可分為五大等級,智能體能夠代表用戶採取行動處於第三階段,其核心架構可概括為「核心決策中樞+核心認知架構+工具使用「。福布斯指出2025年將成為AI應用的分水嶺即AI正從單純的問答和內容生成升級為真正的「執行者」,能夠獨立完成實際工作任務,而不僅僅是充當「助手」。根據LangChain數據,截至2024年底,AI Agent的滲透率已達到43%。
MCP 協議重構AI Agent 新範式
2024年11月,Anthropic發布Model Context Protocol(MCP),自推出以來,MCP迅速成為AI原生應用的重要基礎設施。MCP協議如同AI應用的USB-C端口,其最關鍵的設計理念是將「工具調用」與「上下文感知」統一納入一個協議框架,使得模型與外部世界之間的交互不僅更自然、更精準,還可以跨模型平台共用。MCP協議正在成為AI領域連接大模型與外部世界的核心基礎設施,提升了AI模型與外部服務的兼容性。預計未來MCP協議+Agentic-based決策路徑或將成為主流。
科技巨頭積極佈局AI Agent 產品
從字節和阿里等科技公司近期的動向來看,AI Agent或成為今年科技公司佈局AI 的重要主線。整體來看,AI Agent產業在2024年第四季度至2025年初呈現快速迭代態勢,並逐漸從技術競爭轉向生態價值重構。AI Agent領域的發展還呈現出明顯的結構性分化。根據CB Insights最新統計數據顯示,資本市場對通用型AI Agent展現出更強的偏好。
投資建議
MCP協議正在成為AI時代的「HTTP協議」,AI發展正從「SDK適配」的碎片化階段邁向「協議兼容」的標準化時代。各大科技廠商紛紛開啓AI Agent佈局,有望通過MCP協議引入大量生態夥伴。
建議關注:1)商業平台BIP: 用友網絡;2)辦公:金山辦公;3)AIGC:科大訊飛,萬興科技。
風險提示
AI技術發展不及預期;AI應用落地不及預期;市場需求不及預期;行業競爭加劇等。
一、MCP 協議重構AI Agent 新範式
1.AI Agent 是AI 發展的第三階段
根據OpenAI對AI發展的理解和定義,AI水平可分為五大等級:一是聊天機器人(Chatbot),能夠用自然語言進行對話;二是推理者,基於推理模型,解決人類級別的智力問題;三是智能體(Agent),能夠代表用戶採取行動;四是創新者;五是組織。
過去,在ChatGPT等聊天機器人產品推出時,大模型通常採取一次性推理,用戶與聊天機器人的交互形式呈現為簡單的一問一答。而在推理模型的不斷發展之下,AI模型逐漸能夠與自己對話,實現內部思考,具備推理能力。當前,隨着大模型在交互/認知/泛化/自主等多維度能力持續提升,AI正從推理者轉向智能體,逐步具備採取行動及處理任務的能力,智能體產品加速推進。
圖1:OpenAI定義的5個AI發展階段

資料來源:OpenAI官網,源達信息證券研究所
智能體(Agent)是基於大模型(LLM)構建的智能化系統,其核心架構可概括為「核心決策中樞+核心認知架構+工具使用」。
(1)核心決策中樞:AI Agent的核心決策中樞是其模型系統,它可以由一個或多個不同規模的語言模型組成。這些模型具備執行指令驅動的推理能力,能夠靈活運用多種邏輯框架,如思維鏈(Chain-of-Thought)或思維樹(Tree-of-Thought)等。
(2)核心認知架構:AI Agent的編排層作為其核心認知架構,通過「感知-推理-決策」的閉環機制實現智能決策,主要包含三種模式:ReAct模式為語言模型提供結構化思考框架,使其能自主推理並觸發行動;思維鏈(Chain-of-Thought)模式通過中間推理步驟提升決策質量,衍生出自洽性推理、主動提示和多模態思維鏈等技術分支;思維樹(Tree-of-Thought)模式作為進階形態,支持多路徑探索和戰略前瞻,特別適合解決複雜問題。
(3)工具使用:AI Agent通過工具實現與外部世界的交互,這些工具主要分為三類:擴展程序(Extensions)、函數(Functions)和數據存儲(Data Stores)。儘管基礎模型在文本和圖像生成方面表現出色,但由於無法直接與外界互動,其能力受到限制。工具則彌補了這一缺陷,使Agent能夠訪問外部數據和服務,從而執行基礎模型單獨運行時無法完成的任務。
圖2:AI Agent的結構

資料來源:谷歌《Agent》白皮書,源達信息證券研究所
表1:工具使用的執行和用例
|
擴展 |
函數調用 |
數據存儲 |
||
|
執行 |
Agent-Side 執行 |
Client-Side 執行 |
Agent-Side 執行 |
|
|
用例 |
·開發者希望Agent能夠控制與API端點的交互 ·在利用原生預構建擴展(例如 Vertex 搜索、代碼解釋器等)時很有用 ·多跳規劃和 API 調用(即Agent的下一個操作取決於前一個操作/API調用的輸出) |
·安全或身份驗證限制使Agent無法直接調用 API ·時間限制或操作順序限制使Agent無法實時調用API.(例如:批處理操作、人工審核等) ·未向互聯網公開的 AP,或 Google 系統無法訪問的 API |
·來自預先索引的域和 UR的網站內容 ·以 PDF、Word 文檔、CSV、電子表格等格式存在的結構化數據 ·關係型/非關係型數據庫 ·以 HTML、PDF、TX等格式存在的非結構化數據 |
|
資料來源:谷歌《Agent》白皮書,源達信息證券研究所
表2:編排層的三種模式
|
ReAct |
Chain-of-Thought |
Tree-of-thoughts |
|
|
描述 |
一個提示工程框架,為語言模型提供了一種推理和對用戶查詢採取行動的思維過程策略。 |
一種通過中間步驟實現推理能力的提示工程框架。 |
一種適用於探索或戰略前瞻任務的提示工程框架。 |
|
特點 |
顯示出優於幾個最先進的基準,並提高了人類與 LLM 的互操作性和信任度。 |
包括各種子技術,如自我一致性、主動提示和多模態CoT,每種技術都有其優點和缺點,具體取決於特定的應用程序。 |
超越了鏈式思維提示,並允許模型探索各種思維鏈條,這些思維鏈條作為語言模型解決一般問題的中間步驟。 |
資料來源:谷歌《Agent》白皮書,源達信息證券研究所
2025年4月,福布斯發布AI 50 2025排行榜,指出2025年將成為AI應用的分水嶺即AI正從單純的問答和內容生成升級為真正的「執行者」,能夠獨立完成實際工作任務,而不僅僅是充當「助手」。在企業級和消費級領域,AI工具已開始接管完整的工作流程,例如自動處理法律文件、實現全流程客服自動化以及端到端的代碼生成。
截至2024年底,AI Agent的滲透率已達到43%。據LangChain的數據,同期有43%的AI應用採用了AI Agent框架Lang Graph,這表明AI Agent框架已成為主流開發選擇。與此同時,超過30%的AI應用支持AI調用外部工具(Tool Calling),使模型能夠自主執行函數或訪問外部資源,從而表現出更強的自主決策能力。工具調用的普及增強了AI Agent與外部系統的交互能力,使其能夠執行諸如寫入數據庫等更復雜的任務。
圖3:AI Agent的滲透率

資料來源:LangChain,源達信息證券研究所
- MCP協議定義工具接口標準
AI Agent在快速崛起的過程中,其發展主要圍繞數據交互和決策執行兩條路徑展開。
- 在數據交互方面,有Anthropic推出的標準化MCP協議實現跨平台互通,也有基於GUI自動化的視覺操作方案。
- 在決策模式上,則分化出依賴預設流程的Workflow-based和具備自主決策能力的Agentic-based兩大技術流派。
2024年11月,Anthropic發布Model Context Protocol(MCP),自推出以來,MCP迅速成為AI原生應用的重要基礎設施。MCP協議如同AI應用的USB-C端口,能夠實現允許系統向AI模型提供上下文信息,並且可以在不同的集成場景中通用化。沒有MCP的時候開發者需要為每個數據源創建自定義的整合方式和API,既耗時又無法規模化擴展,而MCP允許AI應用通過統一協議訪問文件系統、數據庫等,定義了AI模型如何調用外部工具、獲取數據以及與各種服務交互。其最關鍵的設計理念是將「工具調用」與「上下文感知」統一納入一個協議框架,使得模型與外部世界之間的交互不僅更自然、更精準,還可以跨模型平台共用。
具體來看,Model Context Protocol (MCP) 採用客戶端-服務器架構實現智能模型與多源數據的協同交互。該協議由MCP Host(用戶操作端)、MCP Client(請求代理端)和分佈式部署的MCP Server節點構成核心框架,通過傳輸層、通知機制、採樣控制等模塊,無縫對接本地文件系統、數據庫、Web API及互聯網資源。
1)MCP Client:MCP Client指的是LLM-native產品或者Agent,比如Claude Desktop產品、IDE產品,未來任何想通過MCP協議調取數據的AI產品都是一個MCP Client,都可以通過MCP協議訪問數據。
2)MCP Server:MCP Server指的是可以讓LLM理解Context Layer的轉換接口,是輕量級Context連接軟件,如文件系統訪問或數據庫查詢。
圖4:MCP系統架構

資料來源:阿里云云原生微信公衆號,源達信息證券研究所
從結構框架層面來看,傳統API與MCP之間存在顯著差異:
1)傳統API:基於經典的「客戶端–服務端」架構,客戶端發起請求,服務器處理並返回響應,傳統API充當二者之間的中介,開發者通常需要分別集成多個服務接口,單獨處理認證、數據格式和通信協議,帶來較高的集成與維護成本,易出現響應機制不一致等問題。
2)MCP:遵循「客戶端服務器」架構,由MCP主機/MCP客戶端/MCP服務器三個核心組件組成,專為AI系統設計,通過標準化協議傳遞模型所需的上下文數據,使模型能夠高效調用工具,提升AI模型的理解與執行能力。
|
圖5:傳統API技術路線 |
圖6:MCP技術路線 |
![]() |
![]() |
|
資料來源:Z Research,源達信息證券研究所 |
資料來源:Z Research,源達信息證券研究所 |
2025年4月9日,Google正式發布了Agent 2 Agent Protocol(A2A)。該協議為不同類型的智能體之間搭建高效溝通與協作的橋樑,無論是獨立Agent與獨立Agent、獨立Agent與企業Agent,亦或是企業Agent與企業Agent,都能借助該協議實現通信交互和事務協作。
- A2A中包含三個核心的參與者:User/Client Agent/Remote Agent。User存在於協議中,主要的作用是用於認證&授權。Client Agent指的是任務發起者,Server Agent指的是任務的執行者。Client和Server之間的通信,可以理解為是一個個簡單的請求和結果的響應,一個Agent既可以是Client也可以是Server。
- A2A與MCP對比:MCP和A2A之間可以實現互相調用,同時A2A也作為MCP的一個補充。具體看,MCP強調的是LLMs/Agent為主體,MCP Server為附屬的模式。而A2A強調的是Agent和Agent之間的相互操作,協議雙端是對等的。
|
圖7:谷歌A2A開放協議工作原理 |
圖8:谷歌A2A與MCP協同工作 |
![]() |
![]() |
|
資料來源:谷歌《Agent》白皮書,源達信息證券研究所 |
資料來源:谷歌《Agent》白皮書,源達信息證券研究所 |
綜上,MCP協議正在成為AI領域連接大模型與外部世界的核心基礎設施,提升了AI模型與外部服務的兼容性。同時,全球科技巨頭已形成協同生態,OpenAI、微軟、谷歌等海外企業率先支持該協議,阿里雲百鍊、騰訊雲等國內廠商也快速跟進並推出標準化接入平台。MCP協議取代了之前傳統的「鏈下模型+鏈上API「架構,預計未來MCP協議+Agentic-based決策路徑或將成為主流,這一轉變將改變AI服務的交互方式和產業格局。
表3:各科技巨頭平台支持MCP統計
|
平台支持 |
|
|
OpenAI |
2025年3月,OpenAl宣佈正式採用MCP協議標準,OpenAI模型可以調用MCP Server。 2025年6月,OpenAI宣佈ChatGPT迎來重大更新,新增兩大功能:支持MCP協議和會議記錄模式。 |
|
谷歌 |
2025年4月,Gemini更新API文檔,正式宣佈接入MCP,Gemini可以調用MCP Server。 |
|
微軟 |
2025年5月,微軟宣佈將在 Azure AlFoundry 和CopilotStudio 兩大平台上引入A2A及MCP。 |
|
阿里雲 |
2025年4月,阿里雲百鍊平台集成了高德、無影、Fetch、Notion等50多款阿里巴巴集團和三方MCP服務。 |
|
騰訊雲 |
2025年4月,騰訊雲大模型知識引擎接入MCP,用戶在搭建應用時,可以通過大模型知識引擎調用平台精選的MCP插件或插入自定義的 MCP 插件,接入騰訊位置服務、微信讀書等生態工具。 |
|
字節 |
飛書多維表格、高德地圖、圖像工具等高頻組件已接入MCP擴展體系。 |
|
百度智能雲 |
2025年4月,兩大模型文心大模型4.5Turbo和深度思考模型X1Turbo,及多款AI應用,並宣佈支持MCP。百度AI搜索,百度地圖、文生圖、圖像識別等能力組件都提供了MCP Server。 |
資料來源:澎湃新聞,鈦媒體,騰訊網,源達信息證券研究所
二、AI Agent 相關應用加速落地
1.科技巨頭積極佈局AI Agent 產品
從字節和阿里等科技公司近期的動向來看,AI Agent或成為今年科技公司佈局AI 的重要主線。整體來看,AI Agent產業在2024年第四季度至2025年初呈現快速迭代態勢,並逐漸從技術競爭轉向生態價值重構。
表4:AI Agent領域行業動態
|
時間 |
產品/技術 |
參與者 |
意義 |
|
2024年12月 |
谷歌 Gemini 2.0驅動的Project Astra(谷歌Al 助手) |
谷歌 |
拓展AI Agent在多領域的應用,推動多模態Al Agent的發展,為用戶提供更全面智能的服務 |
|
2025年1月 |
Al Agent Operator |
Open Al |
拓展Al Agent的功能邊界,為用戶提供更強大的自動化任務執行和知識生成能力推動Al Agent在多領域的應用,代表 Open Al拉開L3級Agent時代序幕 |
|
2025年1月 |
拓爾思拓天大模型 Al Agent工具鏈 |
拓爾思 |
降低Al Agent的創建門檻,推動AI在多個領域的應用落地,具備任務規劃、流程編輯與自動執行功能 |
|
2025年2月 |
GitHub Copilot Agent 模式 |
GitHub |
提升AI在代碼開發中的自主性和智能性,推動軟件開發模式的變革,提高代碼開發的效率和質量 |
|
2025年3月 |
Manus |
Monica.im |
工具鏈整合能力的規模化躍升迎來中國Al Agent重大突破時刻,推動Al Agent從對話智能升級為生產力操作系統 |
|
2025年3月 |
AutoGLM 沉思 |
智譜 |
能夠模擬人類的思維過程,完成從數據檢索、分析到生成報告,核心鏈路的技術與模型於4月全面開源,進一步推動生態發展 |
|
2025年4月 |
Genspark |
MainFunc |
整合多AI模型的混合代理(MoA)系統,包含了80多個工具集和10多個高級數據集,在GAlA Benchmark中表現超越Manus、Open Al、Deep Research等產品 |
|
2025年4月 |
釦子空間 |
字節跳動 |
從回答問題,到解決問題全線打通,擁有專家Agent生態並首創探索/規劃雙模式MCP擴展集成,拓展Agent能力邊界 |
|
2025年4月 |
Qwen3 |
阿里巴巴 |
原生支持MCP,並全面開源,為下游行業構建Agent應用提供模型支持 |
資料來源:甲子光年,各公司官網,源達信息證券研究所
此外,AI Agent領域的發展還呈現出明顯的結構性分化。根據CB Insights最新統計數據顯示,資本市場對通用型AI Agent展現出更強的偏好。
從孖展規模來看,跨行業通用型AI Agent創企累計獲得35億美元孖展,完成149筆交易,而垂直行業型創企僅獲得13億美元孖展,達成65筆交易。前者孖展規模是後者的2.7倍,交易活躍度更是達到2.3倍。
在市場成熟度方面,通用型AI Agent在商業上更為成熟,超過2/3的市場正在部署或擴展AI解決方案,其中,客戶支持、軟件開發、銷售和通用企業工作流程等賽道較為活躍,而垂類智能體仍處於新興和驗證階段,預計未來垂直行業智能體將向部署階段推進。這種「通用先行、垂直跟進」的發展路徑,正推動整個AI Agent產業發展。
圖9:2020年至2025年2月通用型和專業型AI Agent 成熟度份額
資料來源:CB Insight,源達信息證券研究所
- 2.Manus、Operator、Coze等產品佈局側重各不同
Manus作為全球首款通用Agent,憑藉在GAIA基準測試中的SOTA表現和與阿里通義千問的戰略合作,正在推動國產化通用智能體的突破;OpenAI的Operator則通過GPT-4o多模態能力和強化學習技術,重新定義了瀏覽器智能體的交互範式;而字節跳動的Coze平台以低代碼開發和完善的插件生態,正在構建最易用的智能體協同辦公環境。這三類產品分別代表了通用任務處理、垂直場景滲透和開發者生態建設的不同側重的發展路徑,具體來看:
Manus是全球第一款通用Agent產品,可以解決各類複雜多變的任務。在GAIA(General Artificial Intelligence Assistant benchmark)的基準測試中,在所有三個難度級別上都取得了新的SOTA(state of the art)表現,超越OpenAI同級產品。
|
圖10:Manus初始運行界面 |
圖11:Manus執行結果界面 |
![]() |
![]() |
|
資料來源:Manus官網,源達信息證券研究所 |
資料來源:Manus官網,源達信息證券研究所 |
Manus平台宣佈將與阿里通義千問團隊正式達成戰略合作。雙方將基於通義千問系列開源模型,在國產模型和算力平台上實現Manus的全部功能。目前兩家技術團隊已展開緊密協作,致力於為中國用戶打造更具創造力的通用智能體產品,Manus產品使用了不同的基於阿里千問大模型(Qwen)的微調模型。此外,官方將計劃在今年開源Manus中的部分模型,特別是Manus的推理部分。國內廠商有望內化Manus的通用任務執行能力,推出在多個領域具有泛化應用效果的模型,有望進一步推動AI應用的落地。
Operator是由OpenAI於25年1月份發布。該產品是一款由OpenAI推出的AI瀏覽器智能體,由計算機使用代理(Computer-Using Agent,)驅動,結合了GPT-4o的視覺能力以及強化學習下的高級推理,能夠識別網頁並自動實現與網頁的交互,且具備一定的推理能力,可以在遇到問題時自我糾正,可以在無法解決時將控制權交換給用戶。
|
圖12:Operator運行界面 |
圖13:Operator應用場景 |
![]() |
![]() |
|
資料來源:OpenAI官網,源達信息證券研究所 |
資料來源:OpenAI官網,源達信息證券研究所 |
Coze是字節跳動旗下一款重要的 AI Agent 開發平台,發布於2024年2月1日。主要面向普通用戶和開發者。它的特點是簡單易用,無需編程基礎就能快速上手。在釦子平台上,用戶可以通過拖拽式的零代碼方式或簡單的低代碼方式,輕鬆搭建基於先進AI大模型的各類智能體應用。 2025年4月18日,「釦子空間」正式開啓內測。釦子空間的定位「與AI Agent協同辦公的最佳場所」,旨在讓用戶與AI Agent高效協作,完成各種複雜任務。該AI Agent 採用自研豆包大模型並且集成了超過60款MCP擴展插件。
圖14:Coze空間介紹

資料來源:Coze空間官網,源達信息證券研究所
三、投資建議
1.建議關注
MCP協議正在成為AI時代的「HTTP協議」,該標誌着AI發展正從「SDK適配」的碎片化階段邁向「協議兼容」的標準化時代。同時,各大科技廠商紛紛開啓AI Agent佈局,有望通過MCP協議引入大量生態夥伴,推動國內AI Agent產業走向新紀元。
建議關注:1)商業平台BIP : 用友網絡;2)辦公:金山辦公;3)AIGC:科大訊飛,萬興科技。
2.行業重點公司一致盈利預測
表5:萬得一致盈利預測
|
公司 |
代碼 |
歸母淨利潤(億元) |
PE |
總市值(億元) |
||||
|
2025E |
2026E |
2027E |
2025E |
2026E |
2027E |
|||
|
用友網絡 |
600588.SH |
-2.1 |
3.0 |
7.4 |
-217.0 |
150.1 |
60.6 |
451.0 |
|
金山辦公 |
688111.SH |
19.2 |
23.4 |
28.4 |
69.0 |
56.8 |
46.8 |
1,328.5 |
|
科大訊飛 |
002230.SZ |
9.5 |
13.6 |
18.6 |
116.7 |
81.4 |
59.8 |
1,109.4 |
|
萬興科技 |
300624.SZ |
49.3 |
66.8 |
98.3 |
2.3 |
1.7 |
1.2 |
114.1 |
資料來源:Wind一致預期(2025/6/5),源達信息證券研究所
四、風險提示
AI技術發展不及預期;
AI應用落地不及預期;
市場需求不及預期;
行業競爭加劇等。
責任編輯:劉萬里 SF014







