เขียนโดย: KarenZ, Foresight News
Elon Musk เปลี่ยนระบบแนะนำของ Twitter จาก「กฎเกณฑ์ที่สร้างขึ้นด้วยมือและอัลกอริทึมเชิงแนวทางส่วนใหญ่」เป็น「โมเดล AI ขนาดใหญ่ที่คาดเดาได้จากความชอบ」?
เมื่อวันที่ 20 มกราคม Twitter (X) ได้เปิดเผยอัลกอริทึมแนะนำใหม่อย่างเป็นทางการ ซึ่งเป็นกลไกเบื้องหลังของหน้าแรก Twitter 「สำหรับคุณ」 (For You) ในแนวตั้ง
โดยง่าย อัลกอริทึมในปัจจุบันคือ: รวม「เนื้อหาที่คุณติดตาม」และ「เนื้อหาที่อาจถูกใจคุณทั่วทั้งเว็บ」เข้าด้วยกัน จัดลำดับตามความน่าสนใจต่อคุณจากการกดไลก์ คอมเมนต์ ฯลฯ ก่อนหน้านี้ ผ่านการกรองสองรอบ สุดท้ายจะแสดงเป็นข้อมูลแนะนำที่คุณเลื่อนดู
นี่คือแก่นของกลไกที่แปลเป็นภาษาง่ายๆ:
สร้างภาพลักษณ์
ระบบจะเก็บข้อมูลบริบทของผู้ใช้เป็นอันดับแรก เพื่อสร้าง「ภาพลักษณ์」สำหรับการแนะนำในอนาคต:
ลำดับพฤติกรรมผู้ใช้: บันทึกกิจกรรมในอดีต (กดไลก์ แชร์ เวลาที่อยู่บนโพสต์ ฯลฯ)
ลักษณะเฉพาะของผู้ใช้: รายชื่อที่ติดตาม การตั้งค่าความชอบส่วนตัว ฯลฯ
เนื้อหามาจากไหน?
ทุกครั้งที่คุณรีเฟรชแนว「สำหรับคุณ」 อัลกอริทึมจะดึงเนื้อหาจากสองแหล่งนี้:
กลุ่มคนรู้จัก (Thunder): ทวีตจากคนที่คุณติดตาม
กลุ่มคนแปลกหน้า (Phoenix): คุณไม่ได้ติดตาม แต่ AI จะคัดเลือกโพสต์ที่น่าจะสนใจจากกลุ่มคนจำนวนมาก (แม้คุณจะไม่ได้ติดตามผู้เขียน) ออกมา
สองกลุ่มเนื้อหานี้จะถูกรวมกันเป็น「โพสต์ตัวเลือก」
เติมข้อมูลและกรองเบื้องต้น
หลังจากดึงโพสต์เป็นพันเป็นหมื่นรายการ ระบบจะดึงข้อมูลเมตาเต็มรูปแบบของโพสต์ (ข้อมูลผู้เขียน, ไฟล์สื่อ, ข้อความสำคัญ) ซึ่งกระบวนการนี้เรียกว่า Hydration จากนั้นจะทำการคัดกรองอย่างรวดเร็วเพื่อกำจัดเนื้อซ้ำ โพสต์เก่า โพสต์ที่ผู้ใช้โพสต์เอง โพสต์จากผู้เขียนที่บล็อกไว้ หรือเนื้อหาที่มีคำสำคัญที่ถูกบล็อก
ขั้นตอนนี้ช่วยประหยัดทรัพยากรคำนวณและป้องกันไม่ให้เนื้อหาที่ไม่มีประโยชน์เข้าสู่ขั้นตอนการให้คะแนนหลัก
จะให้คะแนนอย่างไร?
นี่คือส่วนที่สำคัญที่สุด โมเดล Transformer ของ Phoenix Grok จะจับตาโพสต์ที่ผ่านการกรองแล้วแต่ละรายการ คำนวณความน่าจะเป็นที่คุณจะทำกิจกรรมต่างๆ กับมัน นี่คือเกมที่เพิ่มคะแนนและลดคะแนน:
คะแนนบวก (Feedback เชิงบวก): AI คิดว่าคุณอาจจะกดไลก์ แชร์ ตอบ โต้ตอบ หรือคลิกดูภาพ หรือเข้าไปที่หน้าโปรไฟล์
คะแนนลบ (Feedback เชิงลบ): AI คิดว่าคุณอาจจะบล็อกผู้เขียน Mute รายงาน
สุดท้าย คะแนนรวม = (ความน่าจะเป็นกดไลก์ × น้ำหนัก) + (ความน่าจะเป็นตอบกลับ × น้ำหนัก) - (ความน่าจะเป็นบล็อก × น้ำหนัก) ฯลฯ
น่าสังเกตว่า ในอัลกอริทึมแนะนำใหม่ ตัววัดความหลากหลายของผู้เขียน (Author Diversity Scorer) มักจะเข้าแทรกแซงหลังจากคำนวณคะแนนสุดท้าย เมื่อพบว่ามีโพสต์หลายชิ้นจากผู้เขียนคนเดียวในกลุ่มตัวเลือก เครื่องมือนี้จะลดคะแนนโพสต์ของผู้เขียนนั้นโดยอัตโนมัติ เพื่อให้คุณเห็นโพสต์จากผู้เขียนที่หลากหลายมากขึ้น
สุดท้าย จัดอันดับโพสต์ตามคะแนนสูงสุด
การกรองรอบสอง
ระบบจะตรวจสอบโพสต์ที่ได้คะแนนสูงสุดก่อนอีกครั้ง เพื่อกรองโพสต์ที่ผิดกฎ (เช่น สแปม เนื้อหากระทบความรุนแรง) และลบโพสต์ซ้ำจากหลายสาขาใน thread เดียวกัน แล้วจัดเรียงตามคะแนนจากสูงไปต่ำ เป็นข้อมูลที่คุณเห็นในแนว
สรุป
X ได้กำจัดฟังก์ชันและอัลกอริทึมเชิงแนวทางส่วนใหญ่ที่ออกแบบด้วยมือในระบบแนะนำแล้ว ความก้าวหน้าหลักของอัลกอริทึมใหม่คือ「ให้ AI เรียนรู้ความชอบของผู้ใช้ด้วยตนเอง」 ซึ่งเป็นการก้าวข้ามจาก「บอกให้เครื่องรู้ว่าจะทำอย่างไร」ไปสู่「ให้เครื่องเรียนรู้วิธีทำเอง」
อันดับแรกคือความแม่นยำในการแนะนำที่ดีขึ้น 「การพยากรณ์หลายมิติ」ที่สอดคล้องกับความต้องการที่แท้จริง อัลกอริทึมใหม่ใช้โมเดลขนาดใหญ่ Grok ทำนายพฤติกรรมผู้ใช้หลายแบบ — ไม่เพียงแค่คำนวณ「จะกดไลก์ / แชร์ไหม」 แต่ยังคำนวณ「จะคลิกลิงก์ดูไหม」「เวลาที่อยู่」「จะติดตามผู้เขียนไหม」และแม้แต่การพยากรณ์「จะรายงาน / บล็อกไหม」 การวิเคราะห์อย่างละเอียดนี้ทำให้ความสอดคล้องระหว่างเนื้อหาแนะนำและความต้องการในจิตใต้สำนึกของผู้ใช้สูงขึ้นเป็นประวัติการณ์
ประการที่สอง กลไกอัลกอริทึมมีความเป็นธรรมมากขึ้น ในระดับหนึ่งสามารถทำลายคำสาปของ「การผูกขาดของบัญชีใหญ่」 ให้โอกาสกับบัญชีใหม่และบัญชีเล็ก: อัลกอริทึมเชิงแนวทางเดิมมีปัญหาสำคัญคือ บัญชีใหญ่ได้เปรียบจากปริมาณการโต้ตอบสูงในอดีต ทำให้โพสต์ใดๆ ก็ได้รับการเปิดเผยสูง ขณะที่บัญชีใหม่ แม้เนื้อหาจะดี ก็ถูกกลบด้วย「ไม่มีข้อมูลสะสม」 ระบบการแยกกลุ่มตัวเลือกทำให้แต่ละโพสต์ถูกให้คะแนนเป็นอิสระจากกัน และไม่ขึ้นอยู่กับ「โพสต์อื่นในกลุ่มเดียวกันเป็นไวรัลไหม」 นอกจากนี้ ตัววัดความหลากหลายของผู้เขียน (Author Diversity Scorer) ก็จะลดการทำซ้ำของโพสต์จากผู้เขียนเดียวกันในกลุ่มเดียวกัน
สำหรับบริษัท X: นี่คือความพยายามลดต้นทุนและเพิ่มประสิทธิภาพ โดยใช้พลังคำนวณแทนคน ใช้ AI แทนการรักษาผู้ใช้ไว้ ในมุมมองของผู้ใช้ เรากำลังเผชิญกับ「สมองกลขนาดใหญ่ที่เข้าใจจิตใจมนุษย์」 มันยิ่งเข้าใจเราเท่าไหร่ เรายิ่งไม่สามารถแยกออกจากมันได้ แต่ก็เพราะมันเข้าใจเราเกินไป เราจะยิ่งตกอยู่ใน「บ้านใกล้เรือนเคียงของข้อมูล」ที่ถูกสร้างโดยอัลกอริทึม และกลายเป็นเป้าหมายที่ถูกจับภาพอย่างแม่นยำของเนื้อหาที่มีอารมณ์ร่วมสูง