終於,清華快手養出了通人性的AI

新智元
05/29

【新智元導讀】當推薦算法行業步入深度深耕階段,行業發展全新增長突破口在哪裏?

多年來,短視頻推薦系統在協同過濾、序列推薦、多目標優化等方向上經歷了多輪技術迭代。

伴隨現有技術體系日漸完善,通過模型結構優化、常規特徵開發、可觀測目標學習帶來的效能提升逐步放緩,行業亟需開闢創新研究思路。

清華大學經濟管理學院的陳柯均博士生、張佳音教授、徐心教授與快手消費策略算法部合作探索完成了一項聯合實驗:從視頻傳遞的價值觀的角度,去理解觀看視頻後用戶的行為和心理變化。

實驗嘗試利用大模型的模擬和推理能力,將社會學和心理學領域中的價值觀理論引入推薦排序策略,並在快手主站進行了大規模隨機在線對比實驗。

初步結果顯示,這一方向不僅技術上可行,更在用戶使用APP時長、電商、直播、社交、搜索等多個業務維度上實現了同步正向增長,創新性且系統性地實現了推薦系統在社會價值觀層面上通過算法手段滿足用戶需求的功能。

技術路徑

如何將抽象的價值觀概念從理論落地到推薦系統,是本項目需要解決的核心問題之一。

團隊基於前期合作的產出[1],分兩個階段完成了 視頻價值的大模型推理 和 輕量蒸餾模型線上生效 的完整解決方案,將離線實驗驗證的方法論轉化為真實推薦系統的策略工具。

圖1–ValueOpt技術框架

大語言模型推理

團隊利用大語言模型模擬短視頻受衆群體,推理不同類型用戶在觀看視頻後的行為和心理變化,進而推斷用戶所能感知到的價值觀,大致方案沿用前期工作[1]。

完整的大模型推理流程針對部分隨機採樣視頻進行,採樣視頻時間跨度為6個月,視頻量累計超過650萬條,基本覆蓋全部類目。

注:實驗中團隊發現,提示大模型在過程中扮演短視頻相關受衆群體,能夠更好地從內容語義層面識別視頻所傳遞的價值觀信號,生成的標註結果會更準確地反映受衆側的感知結果。其中視頻受衆群體的提取在工程上採用了 TagCF[2] 方案,理論上也可以根據場景需求通過自定義的推理模版實現。

輕量蒸餾上線+策略對比試驗

為了應對每天數以千萬計的視頻理解需要,團隊進一步完成了蒸餾模型規模化部署

模型以快手自研的視頻embedding為特徵,以大模型推理結果為監督信號,訓練輕量級蒸餾模型,將大模型強大的受衆模擬和價值觀推理能力遷移到可實時在線高通量服務的小模型中,實現對全量視頻的價值觀標籤預估,從而具備多場景規模化應用的能力。

離線測試發現蒸餾小模型在充分訓練後可以達到85%以上準確率,人工評測也認為其與大模型推理結果無明顯差異,滿足線上落地需求。

視頻價值標籤預估結果在線上推薦系統生效時,存在另一個關鍵挑戰,即視頻價值與用戶可觀測反饋關聯的不可預知性

雖然前期離線實驗已驗證視頻價值推理結果能夠有效提升視頻排序的準確率,但線上真實場景中用戶存在多種反饋信號(APP時長、讚好、關注、打賞、長期留存),目前也並沒有任何理論論證這些反饋信號與視頻價值的相關性和互補性。

此外,團隊也認為不同推薦業務場景下由於其作者生態和消費者群體不同,其價值內容也會呈現明顯差異,因此只有通過完整的線上對比試驗才能準確判斷系統隱藏的價值需求和短板。

線上落地實驗

實驗設計:億級用戶規模驗證

實驗在快手主站精選頁的重排階段進行,採用經典A/B實驗範式

實驗規模:每組約5%流量,每組覆蓋千萬級用戶群體

實驗周期:AA期觀察一周,AB實驗持續進行超過一個月

實驗干預:每個實驗組,在重排階段,適度提升某一類價值觀視頻的分發權重,觀察對各業務指標的影響

初步結果:多業務板塊同步增長

這是本研究最值得關注的發現——價值觀調控能夠拉動多個業務維度,且不同價值與多業務指標關聯存在差異。

內容消費:個人安全組,顯著提升了用戶APP使用時長及留存指標。

直播業務:多個價值觀組別(個人安全、傳統、仁慈-關懷等)對直播送禮金額有顯著正向影響。

電商業務:享樂主義、個人安全、社會安全等價值觀組別對大盤結算GMV有明顯正向貢獻,買家數也呈現同步增長。

社交互動:多個價值觀組別顯著提升了雙關用戶的內容互動與分享行為,平台社交活躍度有所改善。

主動搜索:大多數實驗組均顯著提升了用戶主動搜索次數,其中刺激類價值觀視頻的提升幅度最為突出。

拓展討論和未來方向

為什麼有效?一點理論解讀

這一系列結果背後,有兩個值得深思的發現。

其一,供需平衡需求。原有的推薦分發策略以主題作為內容的主要表徵維度,視頻的價值觀屬性在分發過程中並未被顯式考量。

這意味着,某些價值觀類型的視頻,在平台上的供給比例可能長期低於用戶的潛在需求——當我們主動提升這類內容的分發權重,用戶的正向反饋便隨之而來。

其二,價值觀的行為驅動力。本研究在全體用戶層面統一提升某類價值觀視頻的曝光比例。實驗結果表明,特定價值觀維度的內容在大盤層面更容易激發用戶的觀看、互動與轉化行為。

這一發現也具有一定的理論意義:它將社會心理學中成熟的價值觀理論與推薦系統的內容理解問題連接起來,同時也為價值觀理論本身提供了新的經驗證據——在數字內容消費這一大規模真實場景下,不同價值觀類型對人類行為的影響存在因果性、系統性差異,這是以往依賴問卷或小樣本實驗的價值觀研究所難以探討的問題。

意義與展望

這些發現的意義在於:人類的行為選擇背後,往往由深層價值觀驅動。不同價值觀類型的內容,在激發用戶消費、互動與轉化行為上存在系統性差異。

除視頻主題外,價值觀可以作為視頻內容的一個新維度,幫助推薦系統識別出那些在業務帶動上更具潛力的內容,並通過調整分發策略加以放大。

圖2 – 價值觀在用戶行為和心理轉化中的驅動性影響

此外,本研究展示了一個頗具潛力的方向:將人文社科領域的理論構念引入工業級推薦系統,為工業推薦場景提供了新思路、新視角。

當然,推薦系統作為整合併匹配生產者與消費者資源的核心算法節點,可能其內在本質上就是一個「研究人的學科」。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10