Sui đã đăng tải một bài phân tích hậu sự kiện giải thích về sự cố mất mạng kéo dài sáu giờ vào ngày 14 tháng 1, xác nhận rằng một lỗi đồng thuận đã làm ngưng hoạt động nhưng quỹ người dùng vẫn an toàn.
Tóm tắt
Sui đã đăng tải một bài phân tích hậu sự kiện chi tiết nguyên nhân gây ra sự cố mạng đã làm gián đoạn hoạt động của mạng chính vào ngày 14 tháng 1, 2026, tạm thời ngưng các giao dịch và xác nhận checkpoint trên toàn bộ blockchain.
Trong một bài đăng trên blog ngày 16 tháng 1, nhóm cho biết vấn đề xuất phát từ sự khác biệt trong đồng thuận nội bộ giữa các validator. Họ nhấn mạnh rằng sự gián đoạn này không liên quan đến lưu lượng mạng lớn, các cuộc tấn công từ bên ngoài hoặc các vi phạm an ninh, và quỹ người dùng vẫn an toàn trong suốt sự cố.
Theo Sui (SUI), một lỗi đặc biệt trong cách xử lý các cam kết đồng thuận đã khiến các validator đi đến các kết luận khác nhau khi xử lý các giao dịch mâu thuẫn nhất định. Do đó, các validator bắt đầu tạo ra các ứng viên checkpoint khác nhau, khiến không thể đạt được sự đồng thuận dựa trên trọng số cổ phần cần thiết để xác nhận một checkpoint mới.
Khi các validator phát hiện ra rằng một phần đáng kể cổ phần đang ký các dữ liệu checkpoint mâu thuẫn, mạng đã tạm dừng theo thiết kế. Khoảng dừng này ngăn chặn trạng thái không nhất quán được hoàn tất, mặc dù điều này khiến việc sản xuất block và thực thi giao dịch bị gián đoạn.
Các lệnh gửi giao dịch bị hết hạn trong thời gian mất mạng, nhưng các truy vấn chỉ đọc vẫn cung cấp trạng thái đã được xác nhận cuối cùng.
Hoạt động trên chuỗi bị tạm dừng và ước tính $1 tỷ đô la giá trị đã tạm thời không hoạt động trong khoảng sáu giờ gián đoạn. Không có giao dịch nào bị đảo ngược, cũng không có các nhánh (fork) xảy ra mặc dù mạng tạm dừng.
Quá trình khắc phục bắt đầu khi nguyên nhân gốc rễ được xác định. Các validator đã loại bỏ dữ liệu đồng thuận sai, áp dụng bản vá cho logic cam kết, và phát lại chuỗi từ điểm phân kỳ.
Sau khi các validator của Mysten Labs triển khai thành công bản thử nghiệm, nhóm validator rộng hơn đã nâng cấp và tiếp tục ký checkpoint, cho phép mạng trở lại hoạt động bình thường vào cùng ngày.
Sui cho biết sự cố này xác nhận rằng thiết kế ưu tiên an toàn của họ hoạt động đúng như dự định bằng cách ưu tiên tính nhất quán hơn thời gian hoạt động. Đồng thời, nhóm cũng thừa nhận cần rút ngắn thời gian khắc phục.
Các cải tiến về tự động hóa cho hoạt động của validator, tăng cường kiểm thử để phát hiện các trường hợp đặc biệt của đồng thuận trước khi chúng đến mạng chính, và phát hiện sớm các bất thường trong checkpoint là một số thay đổi dự kiến.
Sau một sự cố ngắn vào cuối năm 2024, sự cố ngày 14 tháng 1 là lần gián đoạn lớn thứ hai của Sui kể từ khi ra mắt vào năm 2023. Giá SUI đã chứng kiến mức biến động hạn chế, cho thấy thị trường phần lớn xem vấn đề này là vận hành chứ không phải cấu trúc.