基於不斷提升的大模型能力,智能體(Agent)成爲今年大模型領域各家最關注的方向。
今年,騰訊首次完整闡述了騰訊雲的大模型戰略,即通過“四個加速”:加速大模型創新、加速智能體(Agent)應用、加速知識庫建設、加速基礎設施升級。值得注意的是,這是騰訊在基礎模型之外,首次提到Agent(智能體)。
近期,騰訊雲大模型知識引擎已經全面升級爲“騰訊雲智能體開發平臺”。基於騰訊雲智能體開發平臺,用戶可以讓Agent自主拆解任務和規劃路徑,主動選擇和調用工具。
騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲在近期接受包括《中國經營報》在內的媒體記者採訪時,回應了關於騰訊雲智能體開發平臺的諸多思考,並直言“每個行業都值得被智能體重構一遍”。
Agent正在快速演進
記者:Agent智能體與傳統軟件應用、SaaS有什麼不同?
吳運聲:Agent具備自主思考和決策能力。傳統的軟件開發範式(包括 SaaS)通常是開發者事先設計好流程,即使存在分支邏輯,也是開發者預先定義好的。但智能體面對的是自然語言交互,用戶的輸入是開放的,不可能窮舉所有分支。這時就需要智能體能夠自主理解、規劃、執行任務,而不是依賴於固定流程。
同時,智能體能融合確定性工作流與自主規劃機制。騰訊雲智能體平臺也支持工作流組件的融合。用戶可以構建確定性的流程來處理特定任務,同時也允許智能體在其中進行自主規劃。這樣就實現了靈活性與確定性的結合,更好地滿足複雜多樣的企業應用場景。
記者:現在開發者社區裏對 Agent 有很多爭議,騰訊如何理解Agent?你們判斷目前是否正處於 Agent 技術發展的一個關鍵路口?
吳運聲:我只是從一個既做技術又做產品的從業者角度談談我的理解。在 to B 場景下,Agent 的本質是一種新的應用形態。它和傳統軟件最核心的區別在於,它具備自主規劃能力,可以根據用戶的自然語言指令,自主調用工具,甚至多個 Agent 協同完成一個複雜任務。這種範式和過去軟件預設流程有本質不同。
從技術角度來看,我們會深入研究以下幾個核心問題:如何實現更精準的自主規劃與執行;如何實現多 Agent 協同的複雜任務處理;如何構建更高效的工具調用機制。
以工具調用技術的演進爲例,它經歷了Function Calling、ReAct 模式、Code Agent(CodeArts)幾個發展階段
舉個例子:如果你要比較中國、日本、新加坡、德國的 iPhone 15 價格,使用Function Calling 技術就是一條條查;使用ReAct 模式,則會在每一步加上“我現在要查價格,我現在要調用匯率”;而 Code Agent 會直接生成一段程序,循環遍歷各國數據、調用接口、換算匯率、返回結果——高效得多。
不論是應用範式還是底層技術,Agent 都在不斷快速演進。
Agent不存在單一固定的技術路線
記者:騰訊雲智能體開發平臺的產品定位與價值是什麼?
吳運聲:我們提出“騰訊雲智能體開發平臺”,因爲它融合了三方面能力:過去積累下來的強大的知識管理能力;支持複雜業務邏輯的工作流編排能力;智能體本身的自主感知與決策能力。
通過這些能力的整合,騰訊希望幫助企業真正用得起、用得好智能體,而不是停留在概念階段。
在組織層面,堅持快速研發前沿技術,同時將技術與客戶需求緊密結合,真正把 AI 能力應用在業務場景中。
記者:從騰訊內部來說,騰訊有個叫“元器”的產品,也是Agent類產品,和現在的騰訊雲智能體開發平臺是什麼關係?
吳運聲: “元器”是一個偏C端的產品,主要是跟“元寶”結合,用來爲個人用戶或輕量開發者提供智能體定製能力,也支持一鍵發佈到元寶或QQ智能體中。
“騰訊雲智能體開發平臺”則是面向B端的企業級平臺,強調的是系統性構建、數據接入、安全隔離、跨角色協作等複雜能力。
記者:從外部來看,今年很多廠商不約而同地在智能體領域加大投入,怎麼看智能體市場發展趨勢?以及各個大廠在技術路線上的選擇?
吳運聲:一是智能體技術快速發展,尤其是智能體具備自我規劃和調用工具完成複雜任務的能力在不斷增強。二是應用業務的發展需求隨着技術提升也在增長,智能體能夠更好地滿足客戶複雜多樣的場景需求。這兩方面共同推動了智能體的快速發展,成爲一個自然且必然的趨勢。
個人認爲Agent開發目前還沒有出現涇渭分明的路線。騰訊專注的是如何構建能力更強、更豐富的Agent應用,這需要調用多種已有能力和不同模型。個人認爲不存在單一固定的技術路線。
怎麼看市場未來發展
記者:目前智能體的應用已經涵蓋了對內對外的信息檢索與處理。從騰訊的視角看,還有哪些場景或者任務更適合用Agent來做?
吳運聲:從C端用戶的角度看,首先接觸到一些比較典型的Agent任務,比如調研寫報告、生成圖片視頻、執行指令類任務等,感受會比較直觀。但從產品和技術人員的角度,其實更關注的是這些Agent背後的核心能力構建。
比如,我們把瀏覽器沙箱與瀏覽器工具集成到了騰訊雲智能體開發平臺中。因爲我們發現,不管是辦公還是生活場景,瀏覽器都是非常核心的交互工具。
如果Agent具備了使用瀏覽器的能力,那它的“行爲邊界”就大大拓展了,可以覆蓋很多真實場景。這也是我們平臺賦予開發者和客戶“想象空間”的關鍵。
未來我們也在研發本地電腦的沙箱能力(Computer Use 插件),讓Agent可以操作本地軟件、編輯文檔、調用工具,就像一個“虛擬操作員”。你設想一下,如果一個Agent不僅能上網、還能幫你打開Excel自動填報表格、用Photoshop批量裁剪圖片,那它在企業內部的價值就會非常大。
記者:目前有哪些行業或場景最適合率先落地Agent應用?
吳運聲:這個問題讓我想起二三十年前,大家問“信息化最適合哪個行業”時的場景。其實現在回頭看,當時任何確定性的回答都不太準確。因爲每一個行業都有自身的複雜性和轉型需求,真正能否落地還是取決於企業自身的理解和推動。
現在智能體的發展就像信息化起步的那個階段,不是某個行業特別適合,而是“每個行業都值得重構一遍”。
只要企業業務複雜度高、知識密度強、人力成本高,Agent技術就有用武之地。關鍵在於業務人員和企業家如何理解Agent與自己場景的結合點。
記者:怎麼看智能體在企業數字化轉型過程中的增長趨勢?在企業落地過程中,當前還有哪些現實挑戰?
吳運聲:“增長”這個詞,個人比較少提。雖然從數據上看,智能體相關的業務增長幅度非常大,但那是因爲起步階段基數很低,目前正處在快速探索期,所以用“增長”來描述可能會有些誤導。
我們更關注的是,智能體如何真正融入企業的業務流程,滿足真實的業務需求。比如在快遞行業的一個落地實踐,就整合了多項技術能力:包括語音合成、數字人能力、語音 PaaS 平臺、瀏覽器插件、多 Agent 協同等。這不是一個簡單的“產品交付”,而是構建了一個高度可組合、可擴展的平臺,企業可以在上面構建適配自己場景的複雜應用。
騰訊面臨的挑戰主要來自兩個方面。首先在技術層面,目前的 Agent 框架仍在快速演進,尤其是在自主規劃(planning)這個環節上,底層模型還不能100%把複雜任務完全準確地拆解並執行。這是模型和框架協同進化的問題。
其次是客戶認知層面,很多客戶還停留在對“Agent”作爲一個新概念的理解階段。但真正要用好 Agent,需要掌握它的使用方式、搭建方法和運行機制。這中間存在一個不小的“認知與使用”的鴻溝,需要通過產品體驗優化、培訓、服務等多種方式不斷去彌合。
(文章來源:中國經營報)
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。