20% cuộc tấn công jailbreak AI tạo sinh thành công trong 42 giây, 90% gây rò rỉ dữ liệu nhạy cảm

• Nghiên cứu từ Pillar Security cho thấy 20% cuộc tấn công jailbreak AI tạo sinh thành công, với thời gian trung bình chỉ 42 giây và 5 lần tương tác.

• 90% cuộc tấn công thành công dẫn đến rò rỉ dữ liệu nhạy cảm.

Các ứng dụng AI hỗ trợ khách hàng là mục tiêu chính, chiếm 25% tổng số cuộc tấn công do vai trò quan trọng trong giao tiếp với khách hàng.

• AI trong các lĩnh vực cơ sở hạ tầng trọng yếu như năng lượng và phần mềm kỹ thuật cũng bị tấn công thường xuyên.

GPT-4 của OpenAI là mô hình thương mại bị nhắm đến nhiều nhất, trong khi Llama-3 của Meta là mục tiêu hàng đầu trong các mô hình nguồn mở.

• Các cuộc tấn công ngày càng phức tạp và thường xuyên hơn, với kẻ tấn công sử dụng các kỹ thuật tinh vi hơn.

• AI tạo sinh làm giảm rào cản tham gia vào các cuộc tấn công mạng, vì prompt có thể được viết bằng ngôn ngữ tự nhiên.

• Tấn công tiêm prompt được liệt kê là lỗ hổng bảo mật hàng đầu trên OWASP Top 10 cho ứng dụng LLM.

• Các cuộc tấn công có thể xảy ra bằng bất kỳ ngôn ngữ nào mà LLM được đào tạo để hiểu.

• Kẻ tấn công thường cố gắng jailbreak các ứng dụng AI tạo sinh hàng chục lần, một số sử dụng công cụ chuyên dụng để tấn công với số lượng lớn.

3 kỹ thuật jailbreak hàng đầu là: Ignore Previous Instructions, Strong Arm Attack và mã hóa Base64.

• 4 động cơ chính để tấn công jailbreak mô hình AI: đánh cắp dữ liệu nhạy cảm, tạo nội dung độc hại, làm suy giảm hiệu suất AI và kiểm tra lỗ hổng hệ thống.

• Các chuyên gia khuyến nghị sử dụng nhà cung cấp thương mại, giám sát prompt ở cấp độ phiên, thực hiện các bài tập red-teaming và khả năng phục hồi, áp dụng giải pháp bảo mật thích ứng theo thời gian thực.

• Dor Sarig, CEO của Pillar Security, nhấn mạnh tầm quan trọng của việc chuẩn bị cho sự gia tăng các cuộc tấn công nhắm vào AI bằng cách thực hiện các bài tập red-teaming và áp dụng phương pháp "bảo mật theo thiết kế".

• Jason Harison, CRO của Pillar Security, nhấn mạnh sự cần thiết của các giải pháp bảo mật AI có khả năng dự đoán và phản ứng với các mối đe dọa mới nổi trong thời gian thực.

📌 20% cuộc tấn công jailbreak AI tạo sinh thành công trong 42 giây, 90% gây rò rỉ dữ liệu nhạy cảm. GPT-4 và Llama-3 là mục tiêu hàng đầu. Các chuyên gia khuyến nghị giám sát prompt, thực hiện red-teaming và áp dụng giải pháp bảo mật thích ứng theo thời gian thực để bảo vệ hệ thống AI.

 

https://www.techrepublic.com/article/genai-jailbreak-report-pillar-security/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo