- Dự luật Trí tuệ Nhân tạo An toàn được đề xuất bởi các Thượng nghị sĩ Mark Warner (D-VA) và Thom Tillis (R-NC), nhằm thiết lập một cơ sở dữ liệu ghi lại tất cả các vụ vi phạm an ninh của hệ thống AI.
- Dự luật này sẽ tạo ra Trung tâm An ninh Trí tuệ Nhân tạo tại Cơ quan An ninh Quốc gia, chịu trách nhiệm dẫn đầu nghiên cứu về "phòng chống AI", bao gồm các kỹ thuật học cách thao túng hệ thống AI.
- Trung tâm này cũng sẽ phát triển hướng dẫn để ngăn chặn các biện pháp phòng chống AI.
- Dự luật yêu cầu Viện Tiêu chuẩn và Công nghệ Quốc gia (NIST) và Cơ quan An ninh Mạng và Cơ sở Hạ tầng (CISA) tạo ra một cơ sở dữ liệu về các vụ vi phạm AI, bao gồm cả những "sự cố suýt xảy ra".
- Các kỹ thuật phòng chống AI được dự luật này tập trung vào bao gồm dữ liệu độc hại, tấn công lẩn tránh, tấn công dựa trên quyền riêng tư, và tấn công lạm dụng.
- Dữ liệu độc hại là phương pháp chèn mã vào dữ liệu được mô hình AI thu thập, làm hỏng kết quả đầu ra của mô hình. Đây đã trở thành phương pháp phổ biến để ngăn chặn các trình tạo hình ảnh AI sao chép nghệ thuật trên internet.
- Tấn công lẩn tránh thay đổi dữ liệu được mô hình AI nghiên cứu đến mức mô hình bị nhầm lẫn.
- An toàn AI là một trong những hạng mục chính trong lệnh hành pháp về AI của chính quyền Biden, yêu cầu NIST thiết lập hướng dẫn "đội đỏ" và yêu cầu các nhà phát triển AI nộp báo cáo an toàn.
- Các công ty như Microsoft đã tạo ra công cụ để giúp thêm dễ dàng các biện pháp an toàn vào các dự án AI.
- Dự luật Trí tuệ Nhân tạo An toàn sẽ phải trải qua một ủy ban trước khi có thể được đưa ra trước Thượng viện rộng lớn hơn.
📌 Dự luật Trí tuệ Nhân tạo An toàn, được đề xuất bởi Warner và Tillis, nhằm thiết lập một cơ sở dữ liệu và Trung tâm An ninh Trí tuệ Nhân tạo để theo dõi và ngăn chặn các vụ vi phạm an ninh AI. Dự luật tập trung vào các kỹ thuật phòng chống AI như dữ liệu độc hại và tấn công lẩn tránh, đồng thời yêu cầu NIST và CISA tạo ra cơ sở dữ liệu về các vụ vi phạm.
https://www.theverge.com/2024/5/1/24146566/ai-security-bill-warner-tillis-senate-redteam-safety