Google Gemini dễ bị tấn công khiến nó tiết lộ dữ liệu nhạy cảm, tạo ra thông tin sai lệch và thực hiện các hành động độc hại,

- Google Gemini, trước đây là Bard, là một công cụ AI đa phương thức có thể xử lý và tạo văn bản, hình ảnh, âm thanh, video và mã.
- Các nhà nghiên cứu tại HiddenLayer phát hiện ra họ có thể thao túng Gemini để tạo ra thông tin sai lệch về bầu cử, giải thích chi tiết cách đấu điện ô tô và khiến nó rò rỉ các lệnh hệ thống.
- Các lỗ hổng này không chỉ có ở Gemini mà còn xuất hiện ở hầu hết các mô hình ngôn ngữ lớn khác như ChatGPT, với mức độ ảnh hưởng khác nhau.
- Các nhà nghiên cứu có thể khiến Gemini tiết lộ cụm mật khẩu bí mật bằng cách đặt câu hỏi khéo léo.
- Bằng cách sử dụng lời nhắc có cấu trúc, các nhà nghiên cứu đã khiến Gemini tạo ra các câu chuyện chứa thông tin sai lệch về bầu cử Tổng thống Mỹ 2024.
- Tương tự, Gemini Ultra cũng cung cấp thông tin về cách đấu điện xe Honda Civic khi được yêu cầu một cách khéo léo.
- Gemini cũng có thể bị lừa tiết lộ thông tin nhạy cảm bằng cách cung cấp đầu vào bất ngờ, được gọi là "uncommon tokens".

📌 Google Gemini và các mô hình AI khác dễ bị tấn công khiến chúng tạo ra nội dung độc hại, rò rỉ dữ liệu nhạy cảm và thực hiện các hành động nguy hiểm. Khi triển khai AI, các công ty cần chú ý đến tất cả các lỗ hổng và phương thức lạm dụng ảnh hưởng đến Gen AI và LLM để giảm thiểu rủi ro.

https://www.darkreading.com/cyber-risk/google-gemini-vulnerable-to-content-manipulation-researchers-say

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo