Theo nghiên cứu của Đại học Chiết Giang được trình bày tại Hội nghị IEEE về An ninh và Quyền riêng tư lần thứ 47 ở San Francisco, các nhà nghiên cứu đã phát triển AudioHijack, ẩn các lệnh không thể nhận biết trong âm thanh để thao túng các mô hình ngôn ngữ âm thanh quy mô lớn với tỷ lệ thành công 79-96%.
Cuộc tấn công chỉnh sửa các dạng sóng âm thanh số theo cách mà con người không thể nhận ra, nhưng làm thay đổi cách AI diễn giải tín hiệu, từ đó cho phép nó ghi đè hành vi của mô hình ngay cả khi có mặt các chỉ dẫn hợp lệ từ người dùng. Các nhà nghiên cứu đã thử nghiệm AudioHijack trên 13 mô hình giọng nói mã nguồn mở và các hệ thống thương mại từ Microsoft và Mistral, phát hiện rằng nó có thể buộc mô hình từ chối yêu cầu, lan truyền thông tin sai lệch, chèn liên kết độc hại hoặc thực hiện các hành động trái phép như tìm kiếm web và tải xuống tệp.