撰文:KarenZ,Foresight News
原標題:大白話拆解 X 新推薦算法:從「撈數據」到「打分」
馬斯克把推特的推薦系統從「人工堆砌規則和大部分啓發式算法」改成了「純靠 AI 大模型猜你喜歡」?
1 月 20 日,推特(X)正式披露新推薦算法,即推特首頁「為你推薦」(For You)時間線背後的邏輯。
簡單來說,現在的算法是:把「你關注的人發的內容」和「全網可能對你胃口的內容」混在一起,根據你之前在 X 上的一連串讚好、評論等動作按對你的吸引力排好序,中間經過兩次過濾,最終變成你刷到的推薦信息流。
以下是用大白話翻譯的核心邏輯:
建立畫像
系統首先收集用戶的上下文信息,為後續的推薦建立「畫像」:
-
用戶行為序列: 歷史互動記錄(讚好、轉發、停留時長等)。
-
用戶特徵: 關注列表、個人偏好設定等。
內容從哪來?
每當你刷新「為你推薦」時間線時,算法會從以下兩個地方找內容:
-
熟人圈(Thunder): 你關注的人發的推文。
-
陌生人圈(Phoenix): 你沒關注,但 AI 會根據你的口味,去茫茫人海中把你可能感興趣的帖子(哪怕你沒關注作者)撈出來。
這兩堆內容會混在一起,就是候選推文。
數據補全和初步過濾
撈上來成千上萬條帖子後,系統會拉取帖子的完整元數據(作者信息、媒體文件、核心文本),這一流程叫 Hydration。然後會先進行一輪快速清洗,剔除重複內容、舊帖、用戶自己發的帖、已拉黑作者的內容或屏蔽關鍵詞的內容。
這一步是為了節省計算資源,避免無效內容進入核心打分環節。
怎麼打分?
這是最關鍵的部分。基於 Phoenix Grok 的 Transformer 模型會盯着每一條過濾過後剩餘的候選帖子,計算你對它做各種動作的概率。這是一個加分與減分的遊戲:
加分項(正向反饋): AI 覺得你可能會讚好、轉發、回覆、點擊圖片、或者點進主頁看。
減分項(負向反饋): AI 覺得你可能會拉黑作者、Mute、舉報。
最終得分 = (讚好概率 × 權重) + (回覆概率 × 權重) – (拉黑概率 × 權重)…
值得注意的是,新推薦算法中 Author Diversity Scorer(作者多樣性打分器)通常會在 AI 算完最終得分之後介入。當檢測到某一批候選帖子裏,有同一個作者的多篇內容時,這個工具會自動「壓低」該作者後續帖子的分數,讓你刷到的作者更多元。
最後,根據按得分排序,挑分數最高的一批帖子。
二次過濾
系統把打分最高的前多少個帖子再檢查一遍,過濾掉違規的(比如垃圾郵件、暴力內容)、給同一個 thread 的多個分支去重,最後按分數從高到低排好,變成你看到的信息流。
小結
X 已經在推薦系統中剔除了所有人工設計的功能和大部分啓發式算法。新算法的核心進步在於「讓 AI 自主學習用戶偏好」,實現了從「告訴機器怎麼做」到「讓機器自己學會怎麼做」的跨越。
首先是推薦更精準,「多維度預判」更貼合真實需求。新算法則靠 Grok 大模型預測多種用戶行為 —— 不僅算「會不會讚好 / 轉發」,還會算「會不會點進鏈接看」、「停留如何」、「會不會關注作者」,甚至會預判「會不會舉報 / 拉黑」。這種精細化的研判,讓推薦內容與用戶潛意識需求的貼合度達到了前所未有的高度。
其次,算法機制相對更公平,在一定程度上可以打破「大號壟斷」的魔咒,給新號、小號更多機會:過去的「啓發式算法」有個致命問題:大號靠歷史高互動量,發什麼內容都能獲得高曝光,新號哪怕內容優質,也因「沒數據積累」被埋沒。候選隔離機制讓每條帖子獨立打分,和「同批次其他內容是不是爆款」無關。同時,Author Diversity Scorer 也會降低同一作者同一批次後續帖子的刷屏行為。
對於 X 公司: 這是一次降本增效的舉措,用算力換人力,用 AI 換留存。對用戶而言,我們面對的是一個時刻揣摩人心的「超級大腦」。它越懂我們,我們越離不開它,但也正因為它太懂我們,我們將更深地陷入算法編織的「信息繭房」,並更容易成為情緒化內容的精準捕獲對象。
Twitter:https://twitter.com/BitpushNewsCN
比推 TG 交流羣:https://t.me/BitPushCommunity
比推 TG 訂閱: https://t.me/bitpush