Mô hình AI do Mỹ phát triển đang đối mặt với các cuộc tấn công phân phối hệ thống có hệ thống của Trung Quốc. Theo báo cáo, các công ty khởi nghiệp Trung Quốc đang sử dụng công nghệ để tránh hạn chế truy cập nhằm đánh cắp mô hình Claude 4.5 của Anthropic, và phát triển ra mô hình Kimi K2.5 có độ tương tự cao. Các công ty khởi nghiệp AI Trung Quốc sử dụng hàng loạt tài khoản giả để thực hiện phân phối dữ liệu và đánh cắp công nghệ AI, trong khi hiện tại vẫn chưa có phương pháp phòng ngừa hiệu quả.
Công ty khởi nghiệp Trung Quốc Moonshot ra mắt Kimi K2.5 có độ tương tự cao với Claude 4.5
Công ty khởi nghiệp AI Moonshot của Trung Quốc đã ra mắt mô hình ngôn ngữ lớn mã nguồn mở Kimi K2.5. Trong giai đoạn đầu ra mắt, khả năng mã hóa của nó thể hiện trình độ kỹ thuật tương đương với mô hình tiên tiến Claude 4.5 của Anthropic. Một số người dùng khi sử dụng đã phát hiện ra rằng mô hình này thậm chí tự xưng là Claude trong một số phản hồi, hành vi bất thường của robot đã thu hút sự chú ý lớn trên mạng xã hội.
Giám đốc Viện Allen về AI, Nathan Lambert, phân tích cho biết Kimi K2.5 xuất hiện tình trạng nhầm lẫn về nhận dạng bản thân, cho thấy rõ ràng rằng mô hình này đã được huấn luyện và tinh chế dựa trên dữ liệu đầu ra của Claude. Hành vi này trong ngành gọi là “tấn công phân phối” (Distillation Attack), nhằm phân tích kết quả đầu ra của các mô hình cao cấp để đảo ngược kỹ thuật và sở hữu trí tuệ cốt lõi. Mặc dù phân phối là phổ biến, nhưng việc khai thác quy mô lớn và không được phép đối với các mô hình thương mại đã chạm đến giới hạn đạo đức.
Anthropic phát hiện các công ty khởi nghiệp AI Trung Quốc sử dụng tài khoản giả để vượt qua hệ thống bảo vệ học Claude
Anthropic tiết lộ rằng ba công ty Trung Quốc là DeepSeek, Moonshot AI và MiniMax, được xem là các nhà cung cấp công nghệ AI mạnh, đã sử dụng hơn 24.000 tài khoản giả để vượt qua hệ thống bảo vệ nhằm học các chức năng của mô hình Claude. Ba công ty này đã thực hiện hơn 16 triệu giao dịch qua nhà phân phối API của bên thứ ba với Claude. Trong đó, Moonshot AI, được hỗ trợ bởi Tencent và Alibaba, đã thực hiện khoảng 3,4 triệu giao dịch, còn MiniMax đạt tới 13 triệu giao dịch, DeepSeek cũng có hơn 150.000 ghi chú. Mặc dù một số nhà phát triển cho rằng hàng chục triệu lượt tương tác không quá lớn đối với quy mô huấn luyện AI hiện đại, nhưng các chuyên gia trong ngành nhận định rằng xu hướng huấn luyện hiện nay đang chuyển từ câu hỏi đơn giản sang các quy trình làm việc phức tạp của các hệ thống trí tuệ. Việc sử dụng dữ liệu tổng hợp từ các mô hình cao cấp của Mỹ để tăng cường hành vi của mô hình Trung Quốc đã trở thành công cụ quan trọng để tối ưu hóa mô hình của các phòng thí nghiệm này. Hành vi khai thác chức năng theo hệ thống này khiến các công nghệ mà các công ty đã bỏ ra nhiều năm và ngân sách lớn để phát triển bị sao chép trong thời gian ngắn.
Cấu trúc quân sự của Mỹ dựa rất nhiều vào trí tuệ nhân tạo, là tài sản chiến lược quan trọng. Vì lý do an ninh quốc gia, Anthropic không cung cấp quyền truy cập thương mại trực tiếp cho người dùng Trung Quốc, nhưng biện pháp này không thể ngăn chặn các doanh nghiệp nước ngoài lấy cắp công nghệ. Các doanh nghiệp Mỹ đã đầu tư hàng nghìn tỷ USD vào nghiên cứu và phát triển AI cùng hạ tầng phần cứng. Nếu lõi công nghệ bị đánh cắp với chi phí rất thấp qua các phương pháp phân phối, lợi thế R&D sẽ bị giảm đáng kể. Nếu mô hình AI rơi vào hệ thống quân sự của các quốc gia không liên minh, rủi ro tiềm ẩn cần được xem xét nghiêm túc. Tuy nhiên, phân phối hiện vẫn thuộc phạm vi xám, phần lớn các mô hình ngôn ngữ lớn trong quá trình huấn luyện đều sử dụng dữ liệu của bên thứ ba không được phép, và dù bị tấn công phân phối quy mô lớn đe dọa an ninh quốc gia, vẫn chưa có giải pháp rõ ràng.
Bài viết này về việc robot Moonshot của Trung Quốc tự xưng là Claude, lộ ra việc phân phối mô hình của Anthropic, lần đầu xuất hiện trên trang tin ABMedia.