Elon Musk đã chỉnh sửa thuật toán đề xuất của nền tảng X thành kiến trúc Transformer và mở mã nguồn, nhưng không công bố trọng số mô hình và dữ liệu huấn luyện.
(Tiền đề: Musk đấu tranh trực tuyến với OpenAI: Ngày xưa “ông lớn” đòi 1340 tỷ USD, cuối cùng tình cảm cũng thất bại trước lợi nhuận? )
(Bổ sung bối cảnh: Trong hướng dẫn cuối cùng để kiếm tiền từ viết bài trên nền tảng X》Musk ra mắt X Articles tăng gấp đôi lợi nhuận, thiết lập đối tượng khán giả, đưa ra sự thật, cắt bỏ lời nói nhảm, quảng bá đăng ký… )
Mục lục bài viết
Vào ngày 20 tháng 1 theo giờ Mỹ, Elon Musk đã tải mã mới của thuật toán đề xuất của nền tảng X có tên “Phoenix” lên GitHub. Tài liệu cho thấy hệ thống đã hoàn toàn chuyển từ việc dựa vào kỹ thuật thủ công như trước sang kiến trúc AI dựa trên Transformer, nhưng không phát hành trọng số mô hình và dữ liệu huấn luyện cùng với mã nguồn.
Trong hơn mười năm qua, xếp hạng tweet của X (trước đây là Twitter) chủ yếu dựa vào các quy tắc “nếu… thì…” do kỹ sư đặt ra, ví dụ như từ khóa, mối quan hệ theo dõi hoặc thời gian lưu lại. Dựa trên cấu trúc mã hiện tại của X được tiết lộ, Phoenix đã loại bỏ phần lớn các đặc trưng thủ công, thay vào đó sử dụng phân tích hành vi người dùng dựa trên Transformer cùng nguồn gốc với Grok thuộc xAI.
Các hành động như thích, chia sẻ, chặn, thời gian xem được xem như các sự kiện liên tiếp, mô hình dự đoán xác suất cho bước tiếp theo để quyết định mức độ và phạm vi hiển thị nội dung.
Trong tài liệu Git, logic tính toán cốt lõi đã được đơn giản hóa thành:
Score = Σ (Probability × Weight)
Điều này thể hiện việc ước lượng xác suất người dùng thực hiện các hành vi khác nhau đối với từng tweet, rồi nhân với trọng số do nền tảng đặt ra.
Ví dụ, nếu xác suất thích là 60%, chặn là 5%, và nền tảng đặt trọng số dương cho “thích” và trọng số âm cho “chặn”, thì điểm cuối cùng sẽ ảnh hưởng trực tiếp đến việc tweet đó có vào luồng đề xuất hay không. Tài liệu còn chỉ ra rằng thời gian lưu lại thậm chí có thể được lượng hóa đến giây, nghĩa là các nhà sáng tạo nội dung sẽ bị thuật toán hướng tới mục tiêu “giữ chân người xem”, còn các trọng số cụ thể của các hành vi thì mã nguồn không tiết lộ.
Dù mã nguồn có thể xem được, nhưng các tham số mô hình thực tế và dữ liệu huấn luyện đầy đủ vẫn chưa được công bố. Phân tích thị trường cho rằng, so với TikTok hay Meta hoàn toàn đóng kín, Phoenix ít nhất cung cấp quy trình tính toán; nhưng thiếu trọng số, các nhà phát triển bên ngoài không thể xác minh hiệu quả đề xuất hay tái tạo mô hình.
Điều này đối lập với việc X lần đầu mở mã nguồn vào năm 2023, khi chỉ tiết lộ một số tham số, Musk đã phản hồi các câu hỏi về minh bạch của cộng đồng như Slashdot bằng cách “mở mã nguồn mang tính trình diễn”, nhưng vẫn giữ vững lợi thế cạnh tranh thực sự.
Phoenix cũng tượng trưng cho việc hệ thống kỹ thuật của X và xAI đã tích hợp, nền tảng X sử dụng dữ liệu tương tác lớn theo thời gian thực để nuôi dưỡng Grok, rồi để Grok điều hướng luồng lượng truy cập, tạo thành vòng khép kín.