1 月 20 日下午,X 公開釋出了新版推薦演算法的原始碼。
Musk 的回應頗具看點:「我們知道這套演算法還很笨,還有很大改進空間,但至少你可以即時看到我們在努力優化。其他社群平台可沒這種魄力。」

這句話有兩層含義:一是坦承演算法有待改進,二是強調「透明化」作為亮點。
這是 X 第二度公開演算法。2023 年那一版三年未更新,早已脫離實際系統運作。本次則徹底重寫,核心模型由傳統機器學習轉向 Grok transformer,官方強調「完全移除了手動特徵工程」。
換句話說:以前的演算法仰賴工程師手動調整參數,現在則讓 AI 直接根據你的互動歷史來決定是否推薦你的內容。
對內容創作者而言,這代表過去「最佳發文時段」、「熱門 tag 增粉」等經驗法則可能失效。
我們也檢視了公開的 Github 儲存庫,在 AI 協助下,確實發現程式碼中隱藏了一些硬邏輯,值得深入分析。
先釐清新舊版本差異,才能正確理解後續討論。
2023 年,Twitter 公開的那一版稱為 Heavy Ranker,屬於傳統機器學習。工程師需手動定義數百項「特徵」:貼文是否有圖片、作者粉絲數、發文距今多久、是否含有連結等等。
接著為每個特徵設定權重,反覆測試最佳組合。
本次公開的新版本名為 Phoenix,架構徹底不同,可視為極度仰賴 AI 大型模型的演算法,核心採用 Grok 的 transformer 模型,與 ChatGPT、Claude 採用類似技術。
官方 README 文件明確指出:「We have eliminated every single hand-engineered feature。」
傳統依賴人工提取內容特徵的規則,已全部移除。
那麼,現行演算法如何判斷內容的優劣?
答案是依據你的行為序列。你過去按過哪些讚、回覆過哪些人、在哪些貼文停留超過兩分鐘、封鎖過哪些帳號。Phoenix 將這些行為輸入 transformer,讓模型自動歸納規則並做出判斷。

比方說:舊演算法像一張人工設計的評分表,逐項打勾計分;
新演算法則像一個看過你所有瀏覽紀錄的 AI,直接預測你下一秒想看什麼。
對創作者來說,這意味著兩件事:
第一,過去「最佳發文時段」、「黃金標籤」等技巧的參考價值大幅下降。因為模型不再依賴這些固定特徵,而是分析每位用戶的個人偏好。
第二,你的內容能否被推薦,愈加取決於「看到你內容的用戶會有何反應」。這些反應被量化為 15 種行為預測,詳情下節說明。
Phoenix 接收到一則待推薦貼文後,會預測當前用戶看到這則內容可能產生的 15 種行為:
每種行為對應一個預測機率。例如模型判斷你有 60% 機率按讚這則貼文、5% 機率封鎖該作者等等。
接著演算法會將這些機率乘以各自的權重,加總,得出一個總分。

公式如下:
Final Score = Σ ( weight × P(action) )
正向行為權重為正數,負向行為權重為負數。
分數高的貼文排名靠前,分數低的則被下沉。
跳脫公式本身,實際上就是:
現在一則內容是否優質,已不再完全取決於內容本身(可讀性與利他性仍是傳播基礎);而是更取決於「這則內容會讓你產生什麼反應」。演算法關注的不是貼文本身,而是你的行為。
依此邏輯,極端情況下,一則低俗但讓人忍不住回覆吐槽的貼文,分數甚至可能高於一則優質但無人互動的貼文。這或許正是這套系統的底層設計。
不過,新版公開的演算法尚未揭露具體行為權重數值,但 2023 年那版曾經公開。
接下來可參考 2023 年的數據,雖為舊版,卻能幫助理解各種行為在演算法中的價值差異。
2023 年 4 月 5 日,X 確實於 GitHub 公開過一組權重數據。
直接看數字:

更直白地說明:

數據來源:舊版 GitHub twitter/the-algorithm-ml 儲存庫,點擊可查看原始演算法
幾個重點值得留意。
第一,按讚幾乎毫無影響。 權重僅 0.5,是所有正向行為中最低的。在演算法看來,一個讚幾乎等於零。
第二,對話互動才是真正的硬通貨。 「你回覆,作者再回你」的權重是 75,是按讚的 150 倍。演算法最重視的不是單向的讚,而是雙向互動。
第三,負向反饋的代價極高。 一次封鎖或靜音(-74)需 148 次按讚才能抵消。一次檢舉(-369)需 738 次按讚。這些負分會累積到你的帳號信譽分,影響所有後續貼文的分發。
第四,影片完播率權重極低。 僅 0.005,可忽略不計。這與抖音、TikTok 形成強烈對比,那兩個平台將完播率視為核心指標。
官方文件亦提及:「The exact weights in the file can be adjusted at any time… Since then, we have periodically adjusted the weights to optimize for platform metrics.」
權重隨時可調整,而且確實經常變動。
新版本雖未公開具體數值,但 README 所述邏輯架構一致:正向加分,負向扣分,加權求和。
數字可能變動,但量級關係大致不變。你回覆別人的評論,效果遠勝於 100 個讚。被封鎖,比沒人互動還要糟糕。
綜合分析 Twitter 新舊演算法程式碼,可歸納出以下建議:
1.回覆你的留言者。 權重表中「作者回覆留言者」為最高分項(+75),是用戶單純按讚的 150 倍。重點不是要求留言,而是有人留言就回覆。即使只回一句「謝謝」,演算法也會記錄。
2.避免讓人想滑走或封鎖。 一次封鎖的負面影響需 148 次按讚才能抵消。爭議內容雖易引發互動,但若互動方式是「這人太煩,直接封鎖」,帳號信譽分會持續受損,影響所有後續貼文。爭議流量是雙面刃,傷人也傷己。
3.外部連結建議放在留言區。 演算法不希望用戶導流至站外。貼文正文帶連結會被降權,Musk 也曾公開說明。若要導流,建議正文寫內容,連結放在第一則留言。
4.避免洗版。 新版程式碼有 Author Diversity Scorer,會對同一作者連續貼文降權。設計目的是讓用戶 feed 更加多元,副作用是連發十則不如精選一則。
6.「最佳發文時段」已成過去式。 舊版演算法有「發文時間」這項人工特徵,新版則已移除。Phoenix 只看用戶行為序列,不管貼文發表時間。那些「週二下午三點發文效果最佳」的攻略,參考價值大幅降低。
以上為程式碼層面可得的結論。
另外還有一些加分/扣分項來自 X 的公開文件,未納入本次開源儲存庫:藍勾認證有加成、全大寫會被降權、敏感內容觸發 80% 觸及率下修。這些規則未公開,本文不贅述。
總結來說,本次公開內容相當具體。
完整的系統架構、候選內容召回邏輯、排序評分流程、各類過濾器實作。程式碼主要以 Rust 和 Python 撰寫,架構明確,README 比許多商業專案還詳細。
但仍有幾項關鍵資訊未公開:
1.權重參數未公開。 程式碼僅說明「正向行為加分,負向行為扣分」,但未揭露按讚多少分、封鎖扣幾分。2023 年那版至少公開了數字,本次僅給出公式架構。
2.模型權重未公開。 Phoenix 採用 Grok transformer,但模型本身參數未公開。你可看到模型如何被呼叫,卻無法得知模型內部運算細節。
3.訓練資料未公開。 模型訓練所用資料、用戶行為如何取樣、正負樣本如何構建,皆未說明。
換句話說,這次開源等於告訴你「我們用加權求和計算總分」,但沒告訴你權重是多少;告訴你「我們用 transformer 預測行為機率」,但沒說 transformer 內部細節。
橫向比較,TikTok 和 Instagram 連這些都沒公開。X 本次公開的資訊量,確實超越其他主流平台,但距離「完全透明」仍有差距。
這並不代表開源毫無價值。對創作者及研究者而言,能檢視程式碼總比無從得知來得好。





