點擊卡片 關注我們
虎嗅智庫薦語:
客服團隊人手不足,傳統機器人聽不懂顧客 「話外音」?零售行業客服智能化落地,如何突破意圖識別難、複雜流程扛不住、大小模型協作亂的困局?
I.T集團的實戰案例給出了破局答案:通過與網易雲商合作,其客服Agent在3.5萬月會話量的高壓下,精準聽懂顧客「話外音」,將售前應答速度提升60%,售後處理時長從7分鐘砍半至3分鐘。
這不僅是一次技術升級,更是一套已被驗證的AI落地方法論。從選擇高頻場景切入,到解決多Agent協同「靜默」、實現大小模型高效協作,它為企業Agent落地提供了從「可用」到「好用」的全路徑參考。
出品 | 虎嗅智庫
作者 | 冀玉潔
雙11前後,各家電商平台的客服團隊都繃緊了弦。當商品諮詢及退換貨需求如潮水般湧來時,人工客服應對艱難,傳統的NLP機器人更是難以招架。
這正是當下衆多零售企業面臨的共同困境,如何讓有限的客服團隊應對持續攀升的會話洪峯?還能既保障服務質量,又控制運營成本?
I.T集團的客服困境就是一個典型代表。集團客服人員規模有限,每月卻要應對2.5萬通會話,大促期間每月超3.5萬,單個售前諮詢處理時長約2分鐘,客服壓力巨大;同時作為採用多品牌買手製的時尚集團,I.T的客服場景更加複雜,從售前尺碼推薦到售後退貨安撫,每個環節都需要精準理解用戶意圖,傳統客服體系難以承載如此高頻且多樣化需求。
面對挑戰,在與網易雲商合作傳統NLP機器人的基礎上,I.T集團選擇了繼續與其客服Agent產品團隊合作。I.T核心訴求非常明確:通過智能化升級,重點提升機器人在複雜場景下的意圖識別與多輪應答能力,緩解客服壓力。
項目組沒有一開始就選擇全面鋪開,而是以「尺碼推薦」「訂單取消」「退貨安撫」這三個高頻且傳統NLP機器人效果不佳的場景作為切入點。這幾個場景的共同特點是需要一定的上下文理解和多輪對話能力,而這正是大模型能夠發揮優勢的地方。
項目經歷了三個關鍵階段的攻堅。
第一階段,要教會AI理解用戶的「話外音」。以退款場景為例,很多時候,客戶不會直接說「我要退款」,而是用「我買多了」、「顏色不對」等模糊表達。團隊通過設計意圖澄清Agent,讓系統學會主動追問,實現會話精準分流。
第二階段需要解決多Agent協同中的「靜默」問題—當遇到用戶突然說「你們服務不錯」這類寒暄語時,一開始從業務目標出發設定的Agent,無法應對此類問答,就會出現靜默狀態,後來團隊專門設定寒暄Agent來承接這類問題,對話才流暢起來。
最後一個階段面對大小模型的協作難題,項目組通過重新劃分知識邊界,常見簡單固定類問答交由NLP機器人處理,複雜諮詢問題交由客服Agent,以此實現效率與體驗的平衡。
最終,該項目從I.T集團的三個試點場景擴展到覆蓋售前、售中、售後客戶服務全旅程的十八個具體場景,售前應答速度提升60%,售後單個處理時長由7分鐘縮短至3分鐘。
I.T的客服Agent案例不僅是一個技術落地案例,更是一次關於如何在企業中務實推進AI應用的深度實踐,其從「場景洞察-試點驗證-數據治理-大小模型協同」的實施路徑,同樣適用於其他想要落地的零售企業。
關於I.TAgent項目落地實施的全過程,虎嗅智庫深度調研了網易雲商的Agent產品負責人,希望為正在探索Agent落地的企業提供有價值的參考。
月均客戶會話量高達2.5萬通,如何破題?
以下為問答摘要,enjoy!
1、I.T集團最想解決的核心業務難題是什麼?
客戶的核心訴求是希望通過智能化升級,提升機器人應答環節的意圖識別效果。這是大模型能力帶來的直接感知,更好地理解用戶對話意圖。
基於更精準的意圖識別,機器人可以實現多輪應答,從而攔截更多原本需要人工接待的會話,以減輕客服團隊的壓力。
I.T集團當時確實面臨着較大的客服接待壓力。因為集團旗下品牌是買手製,品牌也比較多,但其客服團隊規模不大,有多個渠道,客服對話量很大,日常每月承接2.5萬通會話量,大促期間,客服接待壓力更為突出,每月超3.5萬。因此,他們迫切需要智能化的解決方案來應對這一挑戰。
2、在落地實施上,咱們選擇的試點場景是哪些?主要考量依據是什麼?
場景選擇主要綜合以下幾點考量:
第一,高頻性:得是訪客經常詢問的場景;
第二,小模型有瓶頸的場景:原有基於NLP匹配的機器人識別效果不佳的場景;
第三,能力拓展類:一些涉及複雜流程或需要上下文記憶的對話內容,也是一些原有小模型機器人沒有能力處理的場景。
基於以上標準,我們選擇了尺碼推薦、訂單取消與退貨安撫三個主要場景。其中,訂單、退換貨相關的問題更為高頻。
在退換貨場景下,我們分析瞭如何能夠讓agent更獨立地解決問題。在後續的實施中,以工作流的形式,自動通過接口獲取用戶動態信息,以及使用提示詞,實現和用戶自然語言的交互,替代人工客服,完成機械性業務問題的處理。
從最初這三個試點場景開始,最後一共設定十個Agent,落地十八個具體場景。
3、這十八個場景可以歸類嗎?十個Agent是如何分配支撐這些場景的?
可以按照用戶的進線旅程,即售前、售中、售後環節來劃分:
售前,包括尺碼、活動內容諮詢等;售中,物流信息諮詢等;售後退、換貨等相關諮詢。
在分配的十個Agent中,以上面提到的售前尺碼推薦、售後訂單取消和退貨安撫這三個核心場景為主。這十個Agent共同協作,覆蓋十八個場景。
一個Agent並不嚴格限定於只處理一個場景。你可以將其理解為數字員工,一位數字員工可以承擔多項職責。
總體Agent的分配主要看場景複雜度:用一個還是多個Agent,需要根據場景的複雜度進行區分,簡單的場景,例如流程固定的尺碼諮詢,一個Agent就夠了;
此外為區分不同的業務環節,可能也會進行強隔離,由不同的Agent負責不同業務應答。
落地攻堅:教會AI聽懂「話外音」與處理複雜流程
4、可以舉例說明一個Agent處理複雜場景諮詢的例子嗎?
以「退款」場景為例,其複雜性主要在於用戶意圖的多樣性和模糊性。用戶往往不會直接表達「我要退款」,而是會說「我買多了」、「東西不好」或「商品有破損」等。這種模糊的意圖使得系統難以直接觸發退款流程。就像人工客服需要明確意圖一樣,Agent也需要清晰指令才能執行相應技能。
因此,我們協助客戶根據其實際業務,對這些模糊意圖進行梳理和分流設計。例如,當用戶表示「買多了」時,系統會首先澄清顧客意圖:「您是想取消訂單,還是辦理退款?」做完意圖分流之後,才能進入Agent退款的業務流程,通過這樣的多輪對話,將用戶引導至正確的業務流程。
整個退款流程也會涉及多個判斷條件:物流狀態比如是否已發貨、商品條件比如是否超過七天、是否有損壞等。Agent會根據不同狀態,逐步判斷是否符合退款條件。符合條件則進入退款流程,不符合則會提供其他解決方案例如補償券等,或最終轉接人工客服。
在轉人工前,Agent也會總結會話內容,提煉客戶的退款原因及關鍵信息,讓人工坐席能快速了解情況並採取後續措施。
5、整個項目實施周期多長?經歷了哪些主要迭代階段?
整個項目從需求確認到上線主要分為三個階段:
第一階段:重點聚焦Agent的效果實現,構建核心場景流程。項目組為各個場景設計了完整的諮詢應答流程、應答話術以及不同分支情況下的應答處理邏輯。
第二階段:核心在多Agent智能分流與異常處理上。項目組花費較多時間優化多個Agent之間的協同分流調優。常規問題,通過描述可以實現正常分流。
以下兩種情況,不太容易分流:比如訪客的寒暄語處理,部分用戶聊着聊着會說你們「服務不錯」等一些與業務無關的話,因為我們沒有設定專門的寒暄Agent,所以Agent就會靜默,不知道怎麼回,也不知道該分給哪個Agent去做應答。
一開始,所有業務Agent的設計都指向明確具體的業務目標,因為寒暄語不指向具體業務,所以就會出現以上這種靜默情況。為了解決這個問題,項目組增設「寒暄Agent」,當對話中涉及到一些寒暄語時,系統會先到寒暄Agent中去做一輪應答,把這個流程先串起來後,就不會有靜默情況再出現了。
再比如意圖澄清類問答。當用戶的意圖表述不清晰時,也會出現Agent分流失敗的情況。當用戶不直接說自己要退換貨,而是說「你們這件衣服顏色不太正」,這種情況,系統就可能無法直接分流。
因為它意味着多個可能諮詢的方向,可能是覺得衣服圖片和實物顏色不匹配,這是商品諮詢場景;也可能是用戶買完衣服,想看訂單情況,或是用戶想退貨,這就是退換貨場景。當然,還有一些其他的可能,但因為顧客只講了一句話,所以無法判斷真實意圖,也就沒法進行有效分流。
對此,我們設計「意圖澄清Agent」,當顧客意圖表達不清晰時,會先到這個Agent,它會回應用戶,再主動提問以明確顧客具體訴求,比如問「您是諮詢商品詳情,還是想辦理退換貨?」。等了解清楚顧客意圖後,再分流至具體業務Agent。
這也讓我們意識到到,Agent設計應該從用戶視角出發,而不僅是業務視角出發。
第三階段的重點在於大小模型高效協作。因為I.T集團使用我們的小模型三四年,已經積累豐富的小模型知識庫,大部分問題也能通過小模型來應答。疊加大模型之後,關鍵就在於讓大、小模型協作更加高效。
這個問題可以分兩部分來看:第一怎麼順暢地從小模型過渡到大模型,第二大模型應答之後,有些問題還需切回小模型,如何從大模型智能化切回小模型。
這方面,我們也做了比較多的工作。首先,重新做知識劃分:對企業知識進行重新梳理。將簡單的、固定的問答,比如「是否包郵」這類問題保留給小模型;將複雜的、意圖識別困難的,需多輪交互的流程類問題(比如尺碼推薦、退款)劃歸給大模型。
為此,我們將原有小模型知識庫中與大模型場景重疊的部分比如前面提到的十八個場景相關的FAQ進行了「失效」處理,確保這些相關問題由大模型來應答。
其次,設定了靈活的進入路徑,因為大模型沒有覆蓋全部的客戶問答場景,還有部分問答還是分配在小模型中。在這個環節,除了剛纔講的失效之外,我們還針對需要收集用戶多重信息的場景,設定快捷按鈕,比如「我要退貨」「訂單發貨諮詢」、「錯漏發問題」等。
用戶可在I.T集團的小程序中,直接點選相關快捷按鈕,即可快速跳轉至指定Agent,獲取更智能化的回覆。這樣一來,將判斷權交還給用戶的同時,也能提升接待效率和用戶體驗。
圖:I.T集團小程序截圖
來源:網易雲商
6、在關鍵的數據梳理環節,是與對方的什麼團隊溝通的?雙方的協作小組都包括哪些角色?
數據材料由I.T的業務部門提供,但具體與我們對接並協助梳理的,主要是其信息化部門偏IT角色業務支持的角色,並非純技術IT。
I.T側的對接團隊通常是一兩位名核心對接人員,以及三、四位來自相關客戶部門的輔助人員,包括項目經理PM,以及兼具技術理解能力的成員。同時,他們會協調業務方加入。
業務方主要協助兩方面工作:一是業務流程梳理與確認,提供並確認現有業務的運作邏輯與流程;二是真實場景測試:依據企業一線客戶的實際提問方式進行測試,確保Agent的應答效果符合其業務實際需求。
上線只是開始:從「可用」到「好用」纔是落地關鍵
7、正式上線後,用什麼關鍵指標評估Agent表現?
基於多年的客服機器人運營經驗,我們總結出評估智能化應答能力的三大核心指標:
首先,聽懂意圖是前提,需要通過提升意圖識別匹配率,確保溝通順暢。在小模型中,這通過配置相似問句來實現;而在大模型中,則依賴於在提示詞中對意圖進行清晰的定義與描述;
其次,問題解決率,這是最核心的指標,直接衡量Agent是否具備足夠的知識與能力,來真正解決用戶提出的具體業務訴求。
最後,用戶滿意率,關注的是服務交互的體驗與溫度,它關乎品牌形象,也是衡量智能服務是否能從「有用」升級到「好用」的關鍵指標。
8、知識庫信息的更新頻率和流程是怎樣的?
我們將知識大致分為兩類,並採用不同的更新策略:
一類是靜態知識,指短期內穩定的信息,如退換貨政策、運費標準、或者有固定操作流程的知識,比如開發票等。這類知識僅在業務政策發生變動時纔會更新,更新頻率較低。
一類是動態知識,指頻繁變動的信息,如商品信息、優惠活動等。對於這類知識,我們主要通過系統接口對接實現自動化更新。當有新商品上線或價格變動時,業務系統會通過接口實時或準實時地推送到我們的平台,確保客服Agent能立即獲取最新信息進行解答,可以做到基本不依賴人工手動更新。
9、與I.T集團等同類型的客戶合作中,通常會經歷哪些關鍵階段或步驟?
整體上,合作流程可分為需求確認、POC驗證、正式交付三個階段。
首先是需求確認階段的需求洞察與價值測算,在客戶選型前期,他們通常不確定大模型能否為其帶來價值。我們會利用場景洞察平台,分析其業務,明確哪些場景適合應用Agent,並測算可能帶來的價值,例如成本節約或營銷轉化提升。
然後是項目分工與配合,由於現階段,客戶多為首次落地Agent項目,他們非常關心自身需要投入什麼資源,以及我們能提供何種支持。此階段需明確雙方的角色與協作方式,建立客戶對項目安全落地的信心。
充分獲得客戶信任後,就會進入POC價值驗證階段。在客戶投入內部資源進行POC測試前,他們會綜合評估各家廠商的優劣和業務匹配度,在客戶認可後進入正式的POC測試。若最終效果令客戶滿意,通常就會達成正式合作。
在交付階段,即使項目上線,客戶仍可能擔憂後續的自主運營問題,因為Agent的運營方式與傳統小模型機器人完全不同。為此,我們會提供一套成熟的自運營工具,並持續給客戶解答關於是否需要招募專業AI訓練師等這類業務問題,確保客戶能順利接手項目並持續優化。
10、在服務了衆多客戶後,對於Agent在客服或零售場景的成功落地,您認為有哪些關鍵要素?
為了客戶項目的成功落地,我們開發了許多周邊工具,只為了幫助客戶能將系統用得更好。
比如企業的原始知識,像是產品PRD文檔,並不適合直接丟給客服人員或機器人使用,因為比較專業,難以理解。比較好的方式,是可以把它做成產品手冊或者常見問題的FAQ。
但大家可能也會默認這個東西應該是客戶自己去整理,然後告訴客戶,你需要把你的企業知識變成常見問題FAQ,不然的話,這個場景的落地效果就不好。但這樣以來,這個成本就壓在了客戶身上。
比如一個擁有上萬個SKU的鞋服客戶,如果要整理FAQ,可能一年都做不完。
雖然我們提供的是Agent工具,但也會考慮怎麼幫客戶在運營上提效。像我們做的一系列周邊小工具,比如「AI知識萃取」工具,能直接將原始PRD文檔自動轉化為高質量的常見問題(FAQ),這就為客戶省去巨大的整理成本。
當然,即使有了FAQ還不夠,我們也會思考怎麼讓FAQ更好服務客戶。
比如客戶提了一個問題,客服直接解答了,這就算好嗎?其實不然。一個客戶的問題背後是有一個冰層的,而冰層下情況是很複雜的。
舉個例子,當客戶要買一個籃球,FAQ式回答是「好的」,然後直接就給客戶發購買鏈接。接着客戶就下單,最後坐席會說幫我點一個滿意度,這次服務就結束了。
但這次看似完整的服務背後其實是有問題的,為什麼呢?
因為考慮到快遞安全性,籃球在發給客戶的時候氣是會放掉的,坐席雖然解答了客戶要買籃球的這個問題,但沒有考慮到他後面的一些問題。
我們希望在解答客戶問題時,能夠比客戶多想一步。提醒下客戶,籃球是被放掉氣的,可能你還要再買一個充氣的東西,如果需要的話,我可以給你一個鏈接,不管是否需要,都要提醒一下這件事。這些都是常見問題FAQ手冊裏面沒有的,這就是我們提供「AI知識編排」的能力。
客戶只需要把原始文檔丟給我們,知識加工和編排,都可以用我們提供的周邊工具來完成。
用的多了,基於FAQ可能產生了很多歷史對話信息,又可以變成新的AI知識飛輪,飛輪轉起來後,再返回到使用場景裏面,就可以讓項目落地的效果變得越來越好。
掃碼報名 申請加入
虎嗅智庫數字化/AI落地創新實踐交流羣
關於虎嗅智庫
虎嗅智庫是一家聚焦企業數字化、AI創新實踐的新型研究服務機構,為產業智能化進程中的甲乙雙方,提供有洞察性的研究報告、案例評選、以及線上會議、線下活動與參訪服務,以支持企業高管在智能化、數字化方面的明智決策。
我們提供的核心價值
及時與優質的洞察,了解技術、了解行業、了解同行與對手;
為決策者技術與產品戰略決策、產業規劃、解決方案選型提供重要參考;幫助市場全面了解前沿科技及所影響產業的發展狀況,還有未來趨勢;
虎嗅智庫官網:hri.huxiu.com
點
「閱讀原文」看更多報告和活動信息。