獨家|對話淘天凱夫:淘寶AI升級,2025年做了三件事

虎嗅APP
2025/10/18

出品|虎嗅商業消費組

作者|苗正卿

題圖|視覺中國

如何讓一艘正在航行的巨型輪船,在保持前行的同時「換上」新引擎?

這是擺在23歲淘寶面前的「歷史級考題」:擁有10億年度活躍用戶、300餘萬商家、6.5萬億年GMV的淘寶,需要完成一場AI升級。而考題的難點在於,它要一邊確保業績穩中有增,一邊確保用戶和商家感覺不到「升級陣痛」。

虎嗅獨家獲悉,2024年12月,淘天決策層針對AI升級進行了多次會議,經過討論後,內部逐漸梳理出三件「最具確定性」的需要通過AI升級的事情:1.大幅度提高流量匹配效率(搜推廣) 2.為商家增效降本 3.新的AI導購產品。而在2025年3月,三件事陸續啓動。

整個過程,採用了AB測試、灰度上線等阿里傳統打法。虎嗅了解到,上述三個事情,幾乎並行。由阿里巴巴中國電商事業羣搜推智能事業部和CTO技術線共同牽頭,多個兄弟部門協同推動。

從虎嗅視角觀察,這個過程是非常謹慎的。有知情人士告訴虎嗅,所有AI相關新功能、工具,都會從2%用戶量這個階段開始測試。常見的模式是,採用了新AI產品的2%用戶會被納入到一段為期數周的觀察期。在這兩周之內,技術團隊、數據團隊等部門會連夜覆盤,並研究消費者體驗變化背後的原因。

如果一個AI功能或產品,在2%用戶量的維度獲得了不錯的反饋,那麼接下來會進入5%、10%直到50%的漫長測試周期,直到50%這個量級測試依然展現出良好的結果,這個產品/工具才能全量上線。

伴隨這個過程的,是幾個「過去十幾年少有的大項目」的誕生。其中的代表項目是「商品庫」。在過去23年,淘寶積澱了龐大的商品信息庫,但傳統的商品信息和淘寶迫切希望引入的生成式AI大模型之間存在「代溝」——過於潦草、錯誤的商品信息,無法讓大模型理解、學習,也無法讓大模型發揮出真正的實力。

但徹底改造數以幾十億級的商品信息庫無疑是個大工程。虎嗅了解到,淘天把AI作為生產力引入到這個超級工程之中。團隊開發了單獨的AI Agent去自動學習、撰寫商品信息,然後AI Agent還會完成複查環節,基於AI助力,這個在人工時代「多年未解決」的難題,在數個月時間裏得到了顯著效果。而基於這個新商品庫,淘天重新引入了基於大模型的「搜推廣」體系,改變了舊有的流量分配生態。

虎嗅獲悉,自3月開始,淘天陸續完成了商品庫、六個AI創新產品(AI萬能搜、AI Summary、拍立淘、AI幫我挑、AI試衣、AI清單)、搜推廣體系長尾詞複雜詞AI升級、商家AI工具升級等一系列工作。從數據看,這些動作帶來了流量匹配效率雙位數增長。據悉,淘寶複雜語義下搜索相關性提升了20個百分點,推薦信息流點擊量提升10%,商家廣告ROI提升12%。

10月16日,虎嗅在天貓雙11發布會上獲悉,2025天貓雙11將在10月20日晚上8點開賣,今年將是首個AI全面落地的天貓雙11。在用戶側,六款AI創新產品已經在雙11前上線或開啓內測;在搜推廣體系,淘天在雙11前已經完成了包括複雜詞在內的幾個重點AI升級項目。而有品牌商家告訴虎嗅,在今年雙11前,商家後台已經出現了超過至少10款新的AI工具。

AI顯然已經成為本屆雙11,和當下淘寶天貓進化的關鍵詞。

在16日早些時候,虎嗅與阿里巴巴中國電商事業羣搜推智能總裁凱夫進行了獨家交流,這是今年6月份虎嗅與凱夫交流阿里國際AI升級後的再次深入溝通。凱夫分享了他對於淘天AI升級的思考,以及他們在整個過程中的一些基本的、關鍵的邏輯,下附交流實錄,有刪減:

虎嗅:2024年雙11後,您迴歸淘天帶隊推動AI升級,你們團隊思考AI進化的整個脈絡是怎樣的?重點做了哪些事?

凱夫:我覺得本質上關鍵的是圍繞三件事。第一個是「搜推廣」的AI升級,也就是在搜索、推薦、廣告三個方面大幅度提高流量匹配效率;第二個是為商家增效降本,這裏麪包括了很多toB的AI工具,比如美工、客服這些環節;第三個是AI創新產品,主要是一些新的AI導購產品,比如我們的AI萬能搜、AI助手。

虎嗅:這三件事有優先級嗎?你們內部啓動的時間點是有前後順序的,還是幾乎同步?

凱夫:是同時去做的。同時開始討論,同時立項。我們大部分的討論,是在2024年12月就開始了,然後在年初基本上都定下了基本的思路。這三件事,我們整體上是從3月份着手去做的。

虎嗅:為什麼選擇這三件事去做?

凱夫:搜推廣的AI化是我們非常有確定性的一件事。因為搜推廣是所有電商平台的核心,一個電商平台最重要的其實就是它的商品體系加上搜索、推薦、廣告,這構成了電商平台的核心引擎。搜推廣體系的效率和能力,直接決定了消費者能不能找到想要的商品、決定了商家有沒有流量。

其實早在生成式AI誕生前,「搜推廣」就已經是機器學習最重要的應用場景之一。當生成式AI出現後,針對「搜推廣」的AI化,其實有兩種思潮。

第一種思潮認為,搜推廣和生成式大模型是兩條路,也就是說不要把二者融合,而是單獨去基於大模型做一些新的東西。第二種思潮,則是想把商品當成token,用生成式大模型next token prediction的範式徹底改造搜推廣。

這兩種思考,其實本質上都有各自的問題。第一個的問題在於,它把這兩件事看得太割裂了;第二個的問題在於,過於理想主義,步子邁太大了。

所以2025年初,我們做的第一個決定是,認為搜推廣是大模型最好的應用場景,我們決定把跟大模型相關的算力、資源投入到搜推廣這件事上。

此後我們做了第二個決定,就是到底怎麼投入。我們思考後認為,不能像「科幻小說」那樣迅速完成徹底的、未來的改變,而是要基於現有體系做融合,也就是把大模型的能力加進來。

我舉個例子,搜推廣有很多環節,從當下最優解去看,並不是說所有環節都大模型化就最佳。比如索引環節我可以用大模型、相關性判斷環節我可以用大模型,但在個性化預估環節我其實用以前的稀疏模型也是可以的。簡單來說,一些必須依靠大模型去升級的環節,我們去做升級,但並非全面推翻以往的鏈路。這是一種務實的方法。

這裏面還有很多精細化的做法。比如我們會把大模型的能力蒸餾到相對小一點的模型上,簡單說就是用大模型當老師來教小模型。

我來總結一下,在第一件事「搜推廣」AI升級上,我覺得有兩個關鍵點,第一是要把大模型用到搜推廣之中去;第二是,不要做理想主義、不要追求一步到位的系統性替代,而是做融合,讓傳統架構和新架構各自解決擅長的問題。

第二件事是商家側的AI進化。這包括了各種AI工具,這其實涉及了過去20多年阿里的一系列積澱。比如我們的店小蜜,我們很早就有這個產品了,只是之前用的是規則式NLP技術,今天我們把大模型用進來了。這部分其實比較好理解,我就不展開了。

第三件事就是我們的AI創新產品。我們在今年七月、八月、九月一直在測試、上線各種AI產品,我們最早的初衷肯定是希望這些AI產品能帶來一些以往完全沒有的體驗。

我覺得這些產品背後,我們有兩個共性的關鍵邏輯,其一是我們希望每個產品去解決一個用戶痛點。我們沒有去追求一個特別理想主義或者原教旨主義的東西,而是想解決問題。比如我們AI萬能搜想解決複雜場景下商品推薦問題或者說需求發現問題。比如AI助手,我們解決的是挑選難度的問題。

第二個關鍵邏輯是,我們在做一個取捨:到底是把AI產品、工具融入到主產品的使用場景之中去,還是說以「一個超級入口」形式去通過對話解決所有問題。

我們選擇融入使用場景。當然這個不絕對,但我們大部分AI創新產品,是融入或嵌入到使用場景裏的,而不是通過一個獨立入口去做。這背後的決策因素和淘寶用戶天生的動線、習慣有關。我們需要把AI的能力,沉浸式埋入到場景裏。

虎嗅:你講的這三件事,感覺更像是水面上的冰山,水面下似乎還有很多你們做的事情。比如你們今年花了很大精力做升級商品庫?(虎嗅注:從2025年初開始,淘天把過去二十餘年積澱的商品信息庫,做了AI升級,補充了大量更符合大模型學習、理解的商品信息,也做了二十餘年來最大規模的一次徹底梳理

凱夫:你說得很對。我以搜推廣為例,商品庫其實就是搜推廣這件事水面下的部分。因為商品庫是我們做搜推廣AI升級的先決條件。

搜索最簡單的工作原理,就是以搜索詞為出發點,用戶問一個詞,然後引擎把這個詞和商品做匹配。這裏面關鍵點在於商品信息。如果你的商品信息是豐富的、準確的,那麼模型、算法是容易理解的,但如果商品信息缺失或者錯誤,模型和算法是無法理解的。

簡單來說,需要想辦法讓商家儘量多地寫商品信息。寫得越清楚、越明白,我們就越容易用大模型把用戶需求和商品精準匹配起來。那麼怎麼去豐富這些信息呢?我們叫底層數據格式的標準化。以往我們需要用大量人工,去一點點查資料、詢問用戶或者商家,然後補充信息。我們今年通過AI去自動豐富、補全信息,最終重新梳理了整個商品庫的底層索引。

這是淘天的一個超級大項目,牽扯到技術、業務很多團隊。而且這是一個缺少了AI沒法做的事情。我給你舉個例子,在2010年、2011年,淘寶小二每天在做豐富商品信息這件事時,會去買百科全書,比如服飾小二,可能就會買一本紡織工業百科全書,然後去查詢品類商品所包含的關鍵屬性。

我們今年用了一個AI Agent。如果沒有這個AI Agent,我們想重新梳理整個商品庫信息,我跟你講我們都僱不起那麼多的小二人工,那是一個巨大的工程。但AI Agent可以24小時工作,小二只需要去調教AI Agent就可以了。

虎嗅:我想追問一下,就比如你啱啱講的這個用AI Agent去豐富商品庫的細節,這是一個今年做時機恰好的事情,還是說其實去年做更好?

凱夫:這可能是一個天時地利人和的事情。2024年我們團隊有一些積累,但2025年技術更成熟、技術成本更低。或者說,這件事在2025年的成熟度更高了。需求場景存在、技術成本下降、團隊組織的共識更強,所以今年做這個事情挺合適。

虎嗅:我回到主線,聽你剛纔講的三件事以及水面下的事情。感覺比較像是高速路上行駛的汽車要同時換引擎?

凱夫:我覺得換個比喻更合適,我們可能更像是一艘船,然後船一直在前行,我在舊引擎旁邊安裝了一個新引擎。等於我沒有卸下之前的引擎,我裝了倆。

我們在做所有產品技術升級時,我們傳統的業務都在跑。我們一路是靠不斷的AB測試,一點點去推動進化的,測試後數據說話。

虎嗅:你剛纔提到的商品庫,感覺它其實是未來若干年淘天生存發展的一個新基礎設施?

凱夫:你可以這麼理解。

虎嗅:那今年你們做的這些事情或者項目,還有什麼可以屬於這個範疇?

凱夫:我覺得整個搜推廣都屬於這個範疇,這是非常底層的大基建。

虎嗅:這些事情,都是過去八個月左右完成的?

凱夫:我們之前有過一些討論,然後開始做是三月份。搜推廣整體的進化,其實是一個連續的過程,之前幾年我們也在不斷更新。但今年三月份開始,我們在搜推廣上開始有比較大規模的投入,包括針對大模型的算力、資源的投入。

但我覺得,很多事情,確實是淘天這些年動作的延續。比如生意參謀、店小蜜我們都做了很多年了。今年跟以往業務節奏上的差異,我覺得是大項目多一些,比如商品庫就是大項目。

虎嗅:大項目你們是怎麼定義的?

凱夫:就是時間長、投入的資源人力多,一般都是一些相對底層的東西。我們今年團隊的勇氣確實是值得嘉獎的,因為我們挑戰了一些以往很多年沒動的事情。商品庫其實我們過去十幾年並沒有大的質變。

虎嗅:聽你剛纔分享的內容,這種大項目少不了AI這個生產力。之前和你聊,你並沒有通過OKR這些手段去強推團隊用AI工具,今天你依然保持這個思路嗎?

凱夫:我更希望大家是需求驅動。以商品庫這件事為例子,其實根本不需要定一個AI工具相關OKR,因為沒有AI這件事是做不出來的。

虎嗅:從外界視角看,你們做的這些事情,其實是「動筋動骨」的,但同時你們要確保用戶體感在線。這種平衡是怎麼保持的?

凱夫:我們是逐步「切流」,通過新老並存的方式去一點點測試,我們叫灰度上線。其實這些事情,也是靠一個個補丁打起來的。

如對本稿件有異議或投訴,請聯繫tougao@huxiu.com

End

🌀 當速食知識充斥大腦,你選擇深耕還是浮於表面?

🛡️ 當認知壁壘不斷加厚,你是否選擇跨出舒適邊境?

🗺️ 來虎嗅2025F&M創新節,我們一起看點真實的。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10