- Gizmodo đã hỏi 5 chatbot AI hàng đầu 20 câu hỏi gây tranh cãi và phát hiện ra sự kiểm duyệt phổ biến.
- Google Gemini từ chối trả lời 10/20 câu hỏi, nhiều nhất trong số các chatbot được thử nghiệm. ChatGPT, Claude và Meta AI từ chối trả lời cùng 3 câu hỏi. Grok của xAI không kiểm duyệt bất kỳ câu trả lời nào.
- Các chatbot dường như bắt chước câu trả lời của nhau trong nhiều trường hợp, cho thấy các gã khổng lồ công nghệ đang sao chép câu trả lời để tránh thu hút sự chú ý.
- Sự kiểm duyệt này đến từ quá trình "học tăng cường từ phản hồi của con người" (RLHF), trong đó con người can thiệp để dạy mô hình câu trả lời tốt và xấu.
- Ngoài RLHF, "bộ phân loại an toàn" cũng được sử dụng để sàng lọc các câu hỏi trước khi đến mô hình AI cơ bản.
- Các chatbot AI đang đối mặt với sự giám sát chặt chẽ hơn so với công cụ tìm kiếm truyền thống vì chúng đưa ra câu trả lời trực tiếp thay vì chỉ cung cấp các liên kết.
- Ngành công nghiệp đang tranh luận về mức độ thận trọng mà các chatbot nên có. Một số công ty muốn xây dựng các mô hình AI với nhiều biện pháp bảo vệ hơn, trong khi những công ty khác muốn tạo ra chatbot "chống lại sự tỉnh thức".
📌Thử nghiệm của Gizmodo cho thấy sự kiểm duyệt rộng rãi trong 5 chatbot AI hàng đầu, với Google Gemini từ chối trả lời 50% câu hỏi gây tranh cãi. Grok của xAI không kiểm duyệt bất kỳ câu trả lời nào. Các công ty công nghệ dường như đang sao chép câu trả lời của nhau để tránh gây chú ý, tương tự như cách họ xử lý vấn đề kiểm duyệt trên công cụ tìm kiếm và mạng xã hội trước đây.
Citations:
[1]https://gizmodo.com/we-tested-ai-censorship-here-s-what-chatbots-won-t-tel-1851370840