- Hơn 170 hình ảnh và thông tin cá nhân của trẻ em Brazil đã bị thu thập trái phép bởi bộ dữ liệu mã nguồn mở LAION-5B mà không có sự đồng ý, và được sử dụng để huấn luyện AI.
- Các hình ảnh được lấy từ nội dung đăng tải từ năm 2023 cho đến giữa những năm 1990, trước khi người dùng internet có thể dự đoán nội dung của họ sẽ được dùng để huấn luyện AI.
- Các hình ảnh trẻ em được lấy từ các blog của mẹ và blog cá nhân, cũng như từ các video YouTube có lượt xem thấp, có vẻ như được tải lên để chia sẻ với gia đình và bạn bè.
- LAION-5B dựa trên Common Crawl, một kho dữ liệu được tạo bằng cách quét web, và đã được sử dụng để huấn luyện nhiều mô hình AI như công cụ tạo ảnh Stable Diffusion của Stability AI.
- Các nhà nghiên cứu lo ngại cơ sở dữ liệu có thể tiết lộ thông tin nhạy cảm như vị trí hoặc dữ liệu y tế của trẻ em. Năm 2022, một nghệ sĩ Mỹ đã tìm thấy hình ảnh của chính mình trong bộ dữ liệu LAION, và nhận ra nó là từ hồ sơ y tế riêng tư của cô.
- LAION xác nhận các hình ảnh mà các nhà nghiên cứu xác định có tồn tại và đồng ý xóa chúng. Tuy nhiên, việc xóa liên kết khỏi bộ dữ liệu LAION không xóa nội dung khỏi web, các hình ảnh này vẫn có thể được tìm thấy và sử dụng.
- Các nhà nghiên cứu cho rằng trách nhiệm bảo vệ trẻ em và cha mẹ khỏi loại lạm dụng này thuộc về chính phủ và cơ quan quản lý. Brazil đang xem xét luật để quy định việc tạo deepfake, và ở Mỹ, dự luật DEFIANCE cho phép mọi người kiện nếu họ có thể chứng minh một deepfake đã được tạo ra mà không có sự đồng ý.
📌 Hơn 170 hình ảnh và thông tin cá nhân của trẻ em Brazil đã bị thu thập trái phép và sử dụng để huấn luyện AI mà không có sự đồng ý. Các hình ảnh được lấy từ blog cá nhân, video YouTube có lượt xem thấp từ năm 1990 đến 2023. Điều này vi phạm quyền riêng tư của trẻ em và có thể dẫn đến lạm dụng. Mặc dù LAION đồng ý xóa, nhưng các hình ảnh vẫn tồn tại trên web. Các chuyên gia kêu gọi chính phủ và cơ quan quản lý có trách nhiệm bảo vệ trẻ em trước công nghệ này.
https://www.wired.com/story/ai-tools-are-secretly-training-on-real-childrens-faces/