Verfassen: KarenZ, Foresight News
Hat Elon Musk das Empfehlungssystem von Twitter von „manuell erstellten Regeln und den meisten heuristischen Algorithmen“ auf „rein KI-große Modelle, die nach Geschmack vorschlagen“ umgestellt?
Am 20. Januar hat Twitter (X) offiziell den neuen Empfehlungsalgorithmus offenbart, also die Logik hinter der „Für Dich“-Timeline auf der Startseite.
Kurz gesagt, der aktuelle Algorithmus ist: Inhalte von „den Personen, denen du folgst“ und „möglicherweise deinem Geschmack entsprechende Inhalte aus dem ganzen Netz“ werden vermischt. Basierend auf deinen vorherigen Aktionen wie Likes, Kommentaren usw. auf X wird diese Mischung nach Attraktivität für dich sortiert, durchläuft zwei Filterphasen und ergibt schließlich den empfohlenen Informationsfluss, den du siehst.
Hier ist die Kernlogik in einfacher Sprache übersetzt:
Profil erstellen
Das System sammelt zunächst Kontextinformationen des Nutzers, um später Empfehlungen auf Basis eines „Profils“ zu erstellen:
Benutzeraktionssequenz: Historische Interaktionen (Likes, Retweets, Verweildauer usw.).
Benutzereigenschaften: Follow-Listen, persönliche Präferenzen usw.
Woher kommen die Inhalte?
Jedes Mal, wenn du die „Für Dich“-Timeline aktualisierst, sucht der Algorithmus Inhalte aus zwei Quellen:
Bekanntenkreis (Thunder): Tweets von Personen, denen du folgst.
Fremdenkreis (Phoenix): Personen, denen du nicht folgst, aber die KI basierend auf deinem Geschmack aus der großen Masse heraussucht, auch wenn du den Autor nicht folgst.
Diese beiden Inhaltsgruppen werden vermischt, also die Kandidaten-Tweets.
Datenvollständigkeit und erste Filterung
Nach dem Sammeln von Tausenden von Posts ruft das System die vollständigen Metadaten der Posts ab (Autorinformationen, Mediendateien, Kerntest), dieser Vorgang heißt Hydration. Danach erfolgt eine schnelle Reinigung, bei der doppelte Inhalte, alte Posts, eigene Posts, blockierte Autoren oder Inhalte mit blockierten Schlüsselwörtern entfernt werden.
Dieser Schritt spart Rechenressourcen und verhindert, dass unwichtige Inhalte in die Kernbewertung gelangen.
Wie werden die Punkte vergeben?
Das ist der wichtigste Teil. Das Transformer-Modell basierend auf Phoenix Grok analysiert jeden verbleibenden Kandidatenpost und berechnet die Wahrscheinlichkeit, dass du eine bestimmte Aktion ausführst. Es ist ein Spiel aus Plus- und Minuspunkten:
Positive Rückmeldung (Pluspunkte): KI denkt, du wirst liken, retweeten, antworten, auf Bilder klicken oder dein Profil besuchen.
Negative Rückmeldung (Minuspunkte): KI denkt, du wirst den Autor blockieren, stumm schalten oder melden.
Endpunktzahl = (Wahrscheinlichkeit für Likes × Gewicht) + (Wahrscheinlichkeit für Antworten × Gewicht) – (Wahrscheinlichkeit für Blockieren × Gewicht) …
Wichtig ist, dass im neuen Empfehlungssystem der Author Diversity Scorer (Autor-Diversitäts-Bewertung) meist nach der finalen Punktzahl eingreift. Wenn in einer Gruppe von Kandidaten mehrere Posts vom selben Autor vorhanden sind, wird dieses Tool automatisch die Punktzahl der späteren Posts dieses Autors „heruntersetzen“, um eine größere Vielfalt an Autoren in deinem Feed zu gewährleisten.
Abschließend werden die Posts nach Punktzahl sortiert und die mit der höchsten Punktzahl ausgewählt.
Zweite Filterung
Das System überprüft die Top-Posts erneut, entfernt Inhalte, die gegen Regeln verstoßen (z.B. Spam, Gewalt), dedupliziert mehrere Zweige eines Threads und sortiert alles nach Punktzahl, um den endgültigen Informationsfluss zu erstellen.
Kurzfassung
X hat in seinem Empfehlungssystem alle manuell entworfenen Funktionen und die meisten heuristischen Algorithmen entfernt. Der Kernfortschritt des neuen Algorithmus liegt darin, „KI selbstständig Nutzerpräferenzen lernen zu lassen“, was den Übergang von „dem System sagen, was es tun soll“ zu „dem System beibringen, wie es selbst lernen kann“ ermöglicht.
Zunächst ist die Empfehlung präziser, „multidimensionale Vorhersagen“ kommen den tatsächlichen Bedürfnissen näher. Der neue Algorithmus nutzt das Grok-Große-Modell, um verschiedene Nutzerverhalten vorherzusagen – nicht nur, ob man liken/retweeten wird, sondern auch, ob man auf Links klickt, wie lange man verweilt, ob man den Autor folgt oder sogar, ob man meldet/blockiert. Diese detaillierte Einschätzung erhöht die Passgenauigkeit der Empfehlungen auf das Unterbewusstsein der Nutzer erheblich.
Zweitens ist die Algorithmus-Mechanik vergleichsweise fairer und kann das „Monopol großer Accounts“ aufbrechen, indem sie neuen und kleinen Accounts mehr Chancen gibt: Früher hatten heuristische Algorithmen ein fatales Problem: Große Accounts profitieren von hoher Interaktionszahl in der Vergangenheit und erhalten hohe Sichtbarkeit, während neue, qualitativ hochwertige Inhalte aufgrund fehlender Daten untergehen. Das Kandidaten-Isolationssystem bewertet jeden Beitrag unabhängig und ist nicht von „viralen Inhalten in derselben Charge“ abhängig. Zudem reduziert der Author Diversity Scorer das Spammen von Posts desselben Autors in einer Charge.
Für das Unternehmen X: Das ist eine Maßnahme zur Kostensenkung und Effizienzsteigerung, bei der Rechenleistung menschliche Arbeit ersetzt und KI die Nutzerbindung fördert. Für die Nutzer bedeutet das, wir haben es mit einem „Superhirn“ zu tun, das ständig unsere Vorlieben durchschaut. Je besser es uns versteht, desto abhängiger werden wir, doch genau weil es uns so gut kennt, laufen wir Gefahr, in eine „Informationsblase“ aus algorithmisch kuratierten Inhalten zu geraten und leichter Ziel von emotional aufgeladenen Inhalten zu werden.