Cuộc tấn công AudioHijack chiếm quyền các mô hình giọng nói AI với tỷ lệ thành công lên tới 96%, nghiên cứu phát hiện

Theo nghiên cứu của Đại học Chiết Giang được trình bày tại Hội nghị IEEE về An ninh và Quyền riêng tư lần thứ 47 ở San Francisco, các nhà nghiên cứu đã phát triển AudioHijack, ẩn các lệnh không thể nhận biết trong âm thanh để thao túng các mô hình ngôn ngữ âm thanh quy mô lớn với tỷ lệ thành công 79-96%.

Cuộc tấn công chỉnh sửa các dạng sóng âm thanh số theo cách mà con người không thể nhận ra, nhưng làm thay đổi cách AI diễn giải tín hiệu, từ đó cho phép nó ghi đè hành vi của mô hình ngay cả khi có mặt các chỉ dẫn hợp lệ từ người dùng. Các nhà nghiên cứu đã thử nghiệm AudioHijack trên 13 mô hình giọng nói mã nguồn mở và các hệ thống thương mại từ Microsoft và Mistral, phát hiện rằng nó có thể buộc mô hình từ chối yêu cầu, lan truyền thông tin sai lệch, chèn liên kết độc hại hoặc thực hiện các hành động trái phép như tìm kiếm web và tải xuống tệp.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận