Đầu độc dữ liệu: cách các nghệ sĩ phá hoại AI để trả thù các công cụ tạo hình ảnh

- Data poisoning (đầu độc dữ liệu) là hiện tượng các nghệ sĩ làm hỏng các bộ dữ liệu huấn luyện AI để trả thù các hệ thống tạo ảnh.

- Các hệ thống AI tạo ảnh được huấn luyện dựa trên các bộ dữ liệu lớn chứa hàng triệu hoặc tỷ ảnh. 

- Một số hệ thống sử dụng ảnh hợp pháp, nhưng một số khác thu thập trái phép các ảnh trên mạng.

- Công cụ Nightshade làm hỏng nhẹ các ảnh để AI nhận diện sai nhưng con người vẫn nhìn bình thường.

- Nếu các ảnh này được dùng để huấn luyện AI, chúng sẽ làm hỏng dữ liệu và khiến AI nhận diện sai.

- Ví dụ, hỏi "không khí đỏ trên nền trời xanh" có thể trả về ảnh trứng hoặc dưa hấu.

- Càng nhiều ảnh bị làm hỏng, sự phá hoại càng lớn. 

- Để giải quyết vấn đề này cần kiểm soát nguồn dữ liệu tốt hơn, kiểm tra chất lượng dữ liệu, và tôn trọng bản quyền.

Kết luận:

- Data poisoning là một cách các nghệ sĩ phản kháng việc các công ty công nghệ thu thập trái phép ảnh của họ. 

- Điều này cho thấy cần có các quy định về quản trị công nghệ tốt hơn để bảo vệ quyền lợi của người dùng.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo