Thủy vân cho văn bản AI dễ dàng bị xóa và đánh cắp, công nghệ cần cải tiến

- Các nhà nghiên cứu phát hiện ra rằng thủy vân cho văn bản do AI tạo ra rất dễ bị xóa và có thể bị đánh cắp, sao chép, khiến chúng trở nên vô dụng.
- Các cuộc tấn công này làm mất uy tín của thủy vân và có thể đánh lừa mọi người tin tưởng vào văn bản không đáng tin cậy.
- Đạo luật AI của Liên minh Châu Âu, có hiệu lực từ tháng 5, sẽ yêu cầu các nhà phát triển đánh dấu thủy vân lên nội dung do AI tạo ra. Tuy nhiên, nghiên cứu mới cho thấy công nghệ thủy vân tiên tiến nhất không đáp ứng được yêu cầu của cơ quan quản lý.
- Các thuật toán thủy vân hoạt động bằng cách chia từ vựng của mô hình ngôn ngữ thành "danh sách xanh" và "danh sách đỏ", sau đó buộc mô hình AI chọn từ trong danh sách xanh.
- Các nhà nghiên cứu đã tấn công thành công 5 loại thủy vân khác nhau bằng cách sử dụng API để truy cập mô hình AI và tạo ra nhiều lần, từ đó đánh cắp thủy vân bằng cách xây dựng mô hình gần đúng về các quy tắc thủy vân.
- Nhóm nghiên cứu đạt tỷ lệ thành công khoảng 80% trong việc giả mạo thủy vân và 85% trong việc xóa thủy vân khỏi văn bản do AI tạo ra.
- Các nhà nghiên cứu khác cũng phát hiện ra rằng thủy vân không đáng tin cậy và dễ bị tấn công giả mạo.
- Mặc dù vậy, thủy vân vẫn là cách triển vọng nhất để phát hiện nội dung do AI tạo ra, nhưng cần nhiều nghiên cứu hơn để chuẩn bị triển khai trên quy mô lớn.

📌 Thủy vân cho văn bản AI dễ dàng bị xóa và đánh cắp với tỷ lệ thành công lên đến 85%. Mặc dù vẫn là giải pháp triển vọng nhất hiện nay, công nghệ thủy vân cần nhiều cải tiến trước khi sẵn sàng triển khai rộng rãi và đáp ứng các yêu cầu pháp lý như Đạo luật AI của EU.

https://www.technologyreview.com/2024/03/29/1090310/its-easy-to-tamper-with-watermarks-from-ai-generated-text/

#MIT

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo