- Data poisoning (đầu độc dữ liệu) là hiện tượng các nghệ sĩ làm hỏng các bộ dữ liệu huấn luyện AI để trả thù các hệ thống tạo ảnh.
- Các hệ thống AI tạo ảnh được huấn luyện dựa trên các bộ dữ liệu lớn chứa hàng triệu hoặc tỷ ảnh.
- Một số hệ thống sử dụng ảnh hợp pháp, nhưng một số khác thu thập trái phép các ảnh trên mạng.
- Công cụ Nightshade làm hỏng nhẹ các ảnh để AI nhận diện sai nhưng con người vẫn nhìn bình thường.
- Nếu các ảnh này được dùng để huấn luyện AI, chúng sẽ làm hỏng dữ liệu và khiến AI nhận diện sai.
- Ví dụ, hỏi "không khí đỏ trên nền trời xanh" có thể trả về ảnh trứng hoặc dưa hấu.
- Càng nhiều ảnh bị làm hỏng, sự phá hoại càng lớn.
- Để giải quyết vấn đề này cần kiểm soát nguồn dữ liệu tốt hơn, kiểm tra chất lượng dữ liệu, và tôn trọng bản quyền.
Kết luận:
- Data poisoning là một cách các nghệ sĩ phản kháng việc các công ty công nghệ thu thập trái phép ảnh của họ.
- Điều này cho thấy cần có các quy định về quản trị công nghệ tốt hơn để bảo vệ quyền lợi của người dùng.