- Sai lầm của con người thường dễ dự đoán dựa trên kinh nghiệm sống hàng ngày, trong khi sai lầm của AI, đặc biệt là từ các mô hình ngôn ngữ lớn (LLMs), lại mang tính ngẫu nhiên và không có sự tập trung.
- Con người có xu hướng mắc sai lầm trong những lĩnh vực mà họ không thông thạo, thường diễn ra khi cảm thấy mệt mỏi hoặc bị phân tâm. Ngược lại, AI có thể đưa ra sai lầm vào bất kỳ thời điểm nào mà không có lý do rõ ràng.
- Sai lầm của AI không đi kèm với sự ngại ngùng hay thiếu tự tin. Các mô hình như LLM sẽ tạo ra những câu trả lời sai mà vẫn giữ được sự tự tin, điều này làm cho việc đánh giá độ tin cậy trở nên khó khăn hơn.
- Hai hướng nghiên cứu chính cần được phát triển là: (1) cải tiến LLM để tạo ra sai lầm giống như con người, và (2) xây dựng hệ thống sửa đổi mới để xử lý những sai lầm đặc thù của AI.
- Các công nghệ như học tăng cường với phản hồi từ con người đang giúp AI cải thiện khả năng hành xử gần hơn với con người.
- Phát hiện sai lầm của AI có thể sử dụng một số phương pháp hiện có để phòng ngừa sai sót cho con người, nhưng cần phát triển thêm các giải pháp mới. Việc để LLM tự kiểm tra công việc của mình có thể giúp giảm thiểu sai lầm.
- Cách thức hỏi lại câu hỏi nhiều lần theo cách khác nhau có thể tạo ra phản hồi đồng nhất hơn từ AI, mặc dù điều này có thể gây khó chịu cho con người.
- Dù có sự tương đồng, LLM vẫn mắc phải những sai lầm đặc trưng khác như nhạy cảm với cách đặt câu hỏi (prompt sensitivity), dẫn đến những phản hồi hoàn toàn khác nhau với những thay đổi nhỏ trong câu hỏi.
- Một số LLM được cho là hoạt động tốt hơn với các phần thưởng tài chính hoặc bị đe dọa, cho thấy rằng chúng cũng có thể bị tác động bởi các yếu tố động lực như con người.
- Việc giới hạn các hệ thống ra quyết định AI vào những ứng dụng phù hợp với khả năng thực tế của chúng là vô cùng quan trọng để đảm bảo an toàn.
📌 Các sai lầm của AI rất khác so với con người, đòi hỏi các nghiên cứu sâu hơn để xây dựng hệ thống an ninh mới, bảo vệ con người khỏi những rủi ro tiềm ẩn. Cần cải tiến LLM và phát triển các phương pháp phát hiện sai lầm để tận dụng tốt nhất công nghệ AI.
https://spectrum.ieee.org/ai-mistakes-schneier