มาร์คัส（Elon Musk）เมื่อวันที่ 15 พฤษภาคม ได้ประกาศบน X ว่าอัลกอริทึมเวอร์ชันล่าสุดของ X ได้เผยแพร่ไปที่ GitHub แล้ว จาก repository xai-org/x-algorithm ที่ xAI เปิดเผยบน GitHub จุดเด่นของเนื้อหาที่ปล่อยออกมาในครั้งนี้คือระบบแนะนำหลักที่ขับเคลื่อนฟีด “For You” ของแพลตฟอร์ม X ระบบดังกล่าวผสานเนื้อหาภายในที่ผู้ใช้ติดตามไว้แล้ว และเนื้อหาภายนอกที่ดึงออกมาจากคลังเนื้อหาทั่วโลกด้วยการเรียนรู้ของเครื่อง จากนั้นจึงนำไปจัดอันดับด้วยโมเดล transformer ที่อิงสถาปัตยกรรม Grok

โปรเจกต์นี้ใช้สิทธิ์ Apache 2.0 เขียนเป็นหลักด้วย Rust และ Python ณ เวลาที่ทำการค้นหา GitHub แสดงว่า มีประมาณ 2.1 หมื่น stars และ 3,800 forks แล้ว

For You แนะนำสถาปัตยกรรม：Thunder ตามหาสิ่งที่ผู้ใช้ติดตาม，Phoenix ขุดค้นเนื้อหานอกเครือข่าย

ตามเอกสารคำอธิบายของ repository ฟีด For You ของ X ประกอบด้วยแหล่ง “ผู้สมัคร” ของเนื้อหา 2 ประเภทเป็นหลัก

ประเภทแรกคือเนื้อหาภายใน ซึ่งรับผิดชอบโดยโมดูล Thunder Thunder คือพื้นที่เก็บโพสต์แบบหน่วยความจำ (in-memory) และไปป์ไลน์การรับข้อมูลแบบเรียลไทม์ โดยจะบริโภคเหตุการณ์การสร้างและการลบโพสต์จาก Kafka ติดตามโพสต์ล่าสุดของผู้ใช้ทุกคน และส่งผู้สมัครเนื้อหาที่มาจากบัญชีที่ผู้ใช้ติดตามให้กับผู้ร้องขอ เอกสารเน้นว่า Thunder สามารถให้ผู้สมัครเนื้อหาภายในได้ด้วยการสืบค้นระดับมิลลิวินาที โดยไม่ต้องไปสอบถามฐานข้อมูลภายนอก

ประเภทที่สองคือเนื้อหาภายนอก ซึ่งรับผิดชอบโดย Phoenix Retrieval Phoenix จะค้นหาโพสต์ที่ผู้ใช้ “อาจจะสนใจ” แต่ไม่ได้มาจากบัญชีที่ติดตาม โดยขั้นตอนการดึงข้อมูลใช้ Two-Tower Model：User Tower เข้ารหัสคุณลักษณะของผู้ใช้และประวัติการโต้ตอบให้อยู่ในรูปเวกเตอร์ ส่วน Candidate Tower จะเข้ารหัสโพสต์ผู้สมัครให้อยู่ในรูปเวกเตอร์ แล้วจึงหาความเกี่ยวข้องที่สูงที่สุดด้วยความเหมือนเชิงจุด (dot product similarity)

ผู้สมัครเนื้อหาเหล่านี้จะถูกส่งเข้าสู่ Home Mixer ซึ่งเป็นชั้นการประสานงานของฟีด For You Home Mixer จะทำหน้าที่สอบถามบริบทของผู้ใช้ ดึงผู้สมัครเนื้อหา เติมเต็มข้อมูลโพสต์และผู้เขียน กรองเนื้อหาที่ไม่ผ่านเกณฑ์ เรียกโมเดลการจัดอันดับ ปรับสเกลคะแนน (score adjustments) และสุดท้ายเลือกโพสต์ที่จะให้แสดงบนหน้า For You ของผู้ใช้ เอกสารยังระบุว่า Home Mixer มีปลายทางแบบ gRPC ที่เรียกว่า ScoredPostsService เพื่อส่งคืนโพสต์ที่จัดอันดับแล้วให้กับผู้ใช้เฉพาะราย

Grok โครงสร้างเป็นแกนหลักของระบบแนะนำ

ส่วนที่ถูกจับตามากที่สุดในครั้งนี้คือ X ได้มีการนำ Grok เข้ามาในระบบแนะนำอย่างชัดเจน

GitHub README ระบุว่าเนื้อหาใน For You feed จะถูกจัดอันดับโดย Phoenix โดย Phoenix เป็นโมเดล transformer ที่อิง Grok ซึ่งจะคาดการณ์โอกาสที่โพสต์แต่ละรายการจะก่อให้เกิดการโต้ตอบ จากนั้นจึงนำค่าการคาดการณ์เหล่านั้นมาผสมน้ำหนักเพื่อสร้างคะแนนสุดท้าย เอกสารยังชี้ว่าโค้ด transformer ใน repository นี้เป็นการย้ายมาจาก Grok-1 แบบโอเพนซอร์สของ xAI และมีการปรับให้เหมาะกับสถานการณ์ใช้งานของระบบแนะนำ เช่น การเพิ่ม input embedding แบบกำหนดเอง และ attention mask สำหรับการแยกผู้สมัคร

แต่เรื่องนี้ไม่ได้หมายความว่า X จะเปิดเผยโมเดลสำหรับสภาพแวดล้อมการผลิตทั้งหมด Phoenix README เขียนชัดเจนว่าที่เผยแพร่ครั้งนี้คือ mini version ขณะที่การใช้งานจริงใช้โมเดลที่ใหญ่กว่า ซึ่งมีจำนวนชั้นมากขึ้นและ embeddings กว้างขึ้น พร้อมกันนั้น checkpoint เวอร์ชันสาธารณะเป็น snapshot ของช่วงเวลาหนึ่งที่ได้จากการ “แช่แข็ง” หลังผ่านกระบวนการเทรนแบบต่อเนื่อง ส่วน Phoenix ในสภาพแวดล้อมการผลิตจะเทรนต่อเนื่องตามข้อมูลแบบเรียลไทม์

อัปเดตวันที่ 15 พฤษภาคม：รันอินเฟอเรนซ์แบบ end-to-end ได้, โมเดล Phoenix แบบมินิ, ระบบผสมโฆษณา

ตามบันทึกการอัปเดตบน GitHub เวอร์ชันวันที่ 15 พฤษภาคม เพิ่มส่วนประกอบสำคัญหลายอย่าง

อย่างแรกคือกระบวนการรันอินเฟอเรนซ์แบบ end-to-end โค้ด phoenix/run_pipeline.py ใหม่เข้ามาแทนที่ run_ranker.py และ run_retrieval.py ที่ก่อนหน้านี้แยกกัน ทำให้สามารถใช้จุดเริ่มเดียวเพื่อเชื่อมกระบวนการ “retrieval → sorting” และรันด้วย exported checkpoints เพื่อจำลองว่าการประกอบสองช่วงในสภาพแวดล้อมการผลิตทำงานอย่างไร

อย่างที่สองคือไฟล์ artifact ของโมเดลที่ผ่านการพรีเทรน ในครั้งนี้ mini Phoenix model ที่ปล่อยออกมาเผยแพร่ผ่าน Git LFS เอกสารระบุว่าโมเดลดังกล่าวมี embeddings 256 มิติ, 4 attention heads และ transformer 2 ชั้น มีขนาดประมาณ 3GB ทำให้นักพัฒนาสามารถทำ out-of-the-box inference ได้โดยไม่ต้องเทรนโมเดลเอง Phoenix README ยังระบุด้วยว่า demo corpus ที่เผยแพร่คือชุดข้อมูลโพสต์หัวข้อกีฬา จำนวนประมาณ 537,000 ชิ้น ที่มาจากหน้าต่างเวลา 6 ชั่วโมง ใช้สำหรับสาธิตขั้นตอน retrieval

นอกจากนี้ repository ยังเพิ่ม Grox content-understanding pipeline สำหรับงานทำความเข้าใจเนื้อหา เช่น spam detection, post-category classification และ PTOS policy enforcement พร้อมกันนั้นยังเพิ่มระบบผสมโฆษณาของ Home Mixer ซึ่งทำหน้าที่แทรกโฆษณาและจัดตำแหน่งในฟีด พร้อมรวมการติดตามความปลอดภัยของแบรนด์ไว้ด้วย

โมเดลการจัดอันดับทำนายการโต้ตอบ 15 ประเภทในครั้งเดียว ไม่ใช่แค่ “คะแนนความเกี่ยวข้อง” แบบเดียว

โมเดลการจัดอันดับของ Phoenix ไม่ได้ส่งออกมาเพียงคะแนนเชิงนามธรรมของ “ความเกี่ยวข้อง” แต่จะทำนายความน่าจะเป็นของพฤติกรรมการโต้ตอบหลายแบบพร้อมกัน

ตามเอกสาร โมเดลจะทำนายความน่าจะเป็นของพฤติกรรม 15 ประเภท ได้แก่ favorite、reply、repost、quote、click、profile click、video view、photo expand、share、dwell、follow author รวมถึง not interested、block author、mute author、report

จากนั้น Weighted Scorer จะนำความน่าจะเป็นของการโต้ตอบเหล่านี้มาผสมน้ำหนักเพื่อสร้างคะแนนสุดท้าย โดยพฤติกรรมเชิงบวกอย่างกดไลก์ แชร์ ให้ค่าน้ำหนักบวก ส่วนพฤติกรรมเชิงลบอย่างการบล็อก ปิดเสียง และรายงาน จะให้ค่าน้ำหนักลบ เพื่อกดทับเนื้อหาที่ผู้ใช้มีแนวโน้มไม่ชอบให้อยู่ต่ำลง

เมื่อได้คะแนนจากโมเดลแล้ว ระบบจะยังนำไปใช้กับการปรับอื่น ๆ อีก เช่น Author Diversity Scorer จะลดคะแนนของผู้เขียนที่ซ้ำกัน เพื่อรักษาความหลากหลายของฟีด และ OON Scorer จะปรับคะแนนของ out-of-network ซึ่งคือเนื้อหาที่ไม่ได้มาจากบัญชีที่ติดตาม

สิ่งนี้หมายความว่า “For You” ของ X ไม่ได้เป็นแค่การดันโพสต์ที่มีโอกาสถูกกดไลก์สูงขึ้น แต่คือการแยกการคาดการณ์พฤติกรรมการโต้ตอบหลายแบบ แล้วจึงออกแบบน้ำหนักเพื่อสร้างการจัดอันดับสุดท้าย ซึ่งก็แปลว่า “การตัดสินคุณค่าจริง” ของอัลกอริทึมไม่ได้มีแค่ในตัวโมเดลเท่านั้น แต่ยังอยู่ในน้ำหนักการโต้ตอบต่าง ๆ และกฎการประมวลผลภายหลังด้วย

การแยกผู้สมัคร（Candidate Isolation）：คะแนนโพสต์ไม่ควรถูกกระทบจากโพสต์อื่นในชุดเดียวกัน

จุดที่เอกสารครั้งนี้ให้ความสำคัญเป็นพิเศษคือ “Candidate Isolation” Phoenix README ระบุว่าในช่วง ranking โมดูลไม่สามารถให้ผู้สมัครโพสต์ attend กันเองได้ ต้องสนใจได้แค่ผู้ใช้และประวัติของผู้ใช้เท่านั้น การออกแบบนี้มีเป้าหมายเพื่อให้แน่ใจว่าคะแนนของโพสต์แต่ละรายการจะไม่เปลี่ยนเพราะมันถูกใส่ลงใน batch พร้อมกับโพสต์อื่น ๆ ที่เป็นคู่แข่ง นั่นคือ คะแนนของโพสต์ควรขึ้นอยู่กับความสัมพันธ์ระหว่างโพสต์นั้นกับผู้ใช้ ไม่ใช่ว่าในชุดเดียวกันมีโพสต์คู่แข่งแบบใด

สิ่งนี้อาจมีความหมายเชิงกลยุทธ์สำหรับครีเอเตอร์ด้วย ในอดีตมีการคาดเดาจากหลายคอมมูนิตี้ว่า ควรเลี่ยงเวลาที่ชนกับเหตุการณ์ฮอตหรือโพสต์ที่มีการโต้ตอบสูง เพื่อไม่ให้เนื้อหาที่โดดเด่นไปกดทับในพูลแนะนำ แต่หาก Candidate Isolation ถูกนำไปใช้งานตามที่เอกสารอธิบาย อย่างน้อยในชั้นการอินเฟอเรนซ์ของโมเดล คะแนนของโพสต์แต่ละรายการก็จะไม่ถูกเปลี่ยนโดยตรงเพราะมีโพสต์ที่แข็งใน batch เดียวกัน

อย่างไรก็ตาม นี่ไม่ได้หมายความว่าเวลาการโพสต์ไม่สำคัญ เพราะในช่วงต้นของการเรียกผู้สมัคร (candidate recall) ความสดใหม่ของโพสต์ ช่วงเวลาที่ผู้ใช้ใช้งานอยู่ การกรองเนื้อหาที่เคยดูแล้ว การแข่งขันความสนใจจากเหตุการณ์ร้อนแรง ฯลฯ ยังอาจส่งผลต่อการเปิดรับในที่สุด

แนวคิด “ไม่มีฟีเจอร์จากมนุษย์” ยังเป็นที่ถกเถียง：นอกจากการจัดอันดับด้วยโมเดลแล้ว ยังมีการใช้กฎแบบมนุษย์อยู่

ในเอกสาร xAI อ้างว่าระบบได้กำจัดฟีเจอร์ที่ออกแบบโดยมนุษย์ทั้งหมด และกฎเชิงฮิวริสติกส์จำนวนมากแล้ว โดยพึ่งพา Grok-based transformer ในการเรียนรู้ความเกี่ยวข้องจากลำดับการโต้ตอบของผู้ใช้เป็นหลัก เอกสารยังระบุ 5 องค์ประกอบการออกแบบหลัก ได้แก่ ไม่มีฟีเจอร์จากมนุษย์, การแยกผู้สมัครในช่วงการจัดอันดับ, hash-based embeddings, การทำนายหลายพฤติกรรม และโครงสร้าง pipeline ที่ประกอบเข้าด้วยกันได้

แต่คำกล่าวนี้ควรตีความให้แม่นยำกว่า จากเอกสารฉบับเดียวกันก็เห็นว่า ก่อนที่ For You feed จะเข้าสู่การจัดอันดับ ยังผ่าน pre-scoring filters จำนวนมาก เช่น การลบโพสต์ที่ซ้ำ โพสต์ที่เก่ามาก โพสต์ของผู้ใช้เอง โพสต์จากบัญชีที่ถูกบล็อกหรือปิดเสียง คีย์เวิร์ดที่ปิดเสียง เนื้อหาที่เคยดูแล้วหรือปรากฏเมื่อไม่นานนี้ และเนื้อหาที่ไม่เข้าเงื่อนไขที่สมัครรับ ขณะเดียวกันหลังจัดอันดับแล้ว ยังมี post-selection filters เช่น การลบซ้ำ การกรอง spam เนื้อหาที่รุนแรง/เลือดสาด และการตัดแขนงโพสต์ที่ซ้ำในหัวข้อเดียวกันของชุดบทสนทนา เป็นต้น

ดังนั้น คำอธิบายที่แม่นยำกว่าควรเป็น：X ระบุว่า “การจัดอันดับผู้สมัครตามความเกี่ยวข้องของคอนเทนต์” ได้เรียนรู้หลักจาก Grok-based transformer จึงไม่พึ่งพาฟีเจอร์แบบมือดั้งเดิมมากนัก แต่ทั้งระบบ For You ยังมีกฎเชิงผลิตภัณฑ์ตัวอื่นอีกจำนวนมาก ตัวกรอง น้ำหนัก และกลไกหลังการประมวลผล กฎเหล่านี้ก็จะกำหนดว่าผู้ใช้จะเห็นเนื้อหาใดในที่สุด

ภาคปฏิบัติ：จะใช้ประโยชน์จากอัลกอริทึม X เพื่อบริหารบัญชีอย่างไร

ในภาคปฏิบัติ หากครีเอเตอร์ต้องการ “เดินตามอัลกอริทึม” เพื่อบริหารบัญชี X จุดสำคัญไม่ใช่แค่การพยายามให้คนกดไลก์หรือรีโพสต์ แต่คือการเข้าใจว่า For You จะประเมินสัญญาณการโต้ตอบหลายแบบพร้อมกัน สัญญาณเชิงบวก ได้แก่ เวลาในการค้าง, การคลิก, การตอบกลับ, การรีโพสต์, การติดตามผู้เขียน, การดูวิดีโอ และการขยายภาพ สัญญาณเชิงลบ ได้แก่ ไม่สนใจ, ปิดเสียง, บล็อก และรายงาน

นั่นหมายความว่าเนื้อหาไม่สามารถพึ่งพาแค่พาดหัวชวนคลิก เพราะถ้าผู้ใช้คลิกเข้ามาแล้วเลื่อนผ่านเร็ว กด “ไม่สนใจ” หรือถึงขั้นบล็อกผู้เขียน กลับจะทำให้ผลการแนะนำในรอบถัดไปแย่ลงได้

สำหรับผู้บริหารบัญชี กลยุทธ์ที่ได้ผลมากกว่าคือการเพิ่ม “คุณภาพของการโต้ตอบ” คือช่วงเปิดต้องดึงความสนใจให้ได้ในไม่กี่วินาทีแรก เนื้อหาควรทำให้คนอ่านและอยู่กับมันได้ และช่วงท้ายควรออกแบบประเด็นที่ทำให้ผู้อ่านตอบกลับหรือแชร์ได้อย่างเป็นธรรมชาติ ไม่ใช่ไปบังคับให้เกิดการโต้ตอบ นอกจากนี้ เนื่องจากระบบมีการปรับความหลากหลายของผู้เขียน การโพสต์ถี่ ๆ ในช่วงสั้นแบบถี่มากไม่ได้จำเป็นว่าจะเพิ่มการมองเห็นแบบเชิงเส้น เสมอไป ในทางกลับกันอาจถูกผู้เขียนเดียวกันถ่วงน้ำหนักลงจนเจือจาง ยิ่งกว่าควรทำคือควบคุมจังหวะการโพสต์ ให้แต่ละชิ้นมีหัวข้อชัดเจน มีความหนาแน่นของข้อมูลเพียงพอ และมีท่าทีที่สามารถนำไปต่อและแชร์ต่อได้

สุดท้าย การแนะนำเนื้อหานอกเครือข่ายหมายความว่าบัญชีไม่จำเป็นต้องพึ่งพาแค่ผู้ติดตามเดิมเท่านั้น หากเนื้อหาทำให้ผู้ชมหน้าใหม่เกิดการค้าง การคลิก และพฤติกรรมการติดตาม ก็มีโอกาสถูกดันเข้าไปในพูลทราฟฟิกขนาดใหญ่ของ For You ได้ แต่เงื่อนไขคือหลีกเลี่ยงเนื้อหาคุณภาพต่ำ ฟาร์มคอนเทนต์ที่ซ้ำ และการกระทำที่ก่อข้อถกเถียงเกินพอดี เพราะเมื่อพฤติกรรมเหล่านี้นำไปสู่การปิดเสียง บล็อก หรือรายงาน การลงโทษของอัลกอริทึมมักหนักกว่าผลประโยชน์ทราฟฟิกระยะสั้น

บทความนี้ X เผยโค้ดต้นฉบับอัลกอริทึมแนะนำ “For You”：คำแนะนำเชิงปฏิบัติสำหรับการบริหารบัญชีบน Twitter ให้ใช้ประโยชน์จากอัลกอริทึม เผยแพร่ครั้งแรกบน 鏈新聞 ABMedia。

news.article.disclaimer

news.related.news

05-16 09:40

อีลอน มัสก์ อ้างว่า Grok V9 (พารามิเตอร์ 1.5 ล้านล้าน) แสดงประสิทธิภาพกระโดดครั้งใหญ่เหนือ V8 ในวันที่ 16 พฤษภาคม

05-16 02:03

X ปล่อยอัปเดตอัลกอริทึมครั้งใหญ๋ด้วยตรรกะ Ad-Mix โดยมีการเปลี่ยนแปลงไฟล์จำนวน 187 ไฟล์ตั้งแต่เดือนมกราคม

05-15 15:01

Grok V9 ของ Elon Musk ทำการฝึกเสร็จสิ้นด้วยพารามิเตอร์ 1.5 ล้านล้านตัว และแสดงให้เห็นถึงประสิทธิภาพที่กระโดดขึ้นอย่างมากเหนือ V8

btc.bar.articles

SpaceX มีแนวโน้มเข้าจดทะเบียนในวันที่ 12/6 เพื่อพยายามเข้ากลุ่มดัชนี Nasdaq 100

ChainNewsAbmedia05-16 03:04

Codex เข้าสู่แอปมือถือของ ChatGPT สามารถควบคุมงานพัฒนา Mac ระยะไกลได้