OpenAI tiết lộ lý do AI chatbot "ảo giác": vì được thưởng khi đoán mò

  • OpenAI công bố nghiên cứu mới, chỉ ra nguyên nhân chính khiến chatbot AI như GPT-5 và Claude thường tạo ra thông tin sai lệch nhưng đầy tự tin – hiện tượng gọi là “hallucination.”

  • Theo nghiên cứu, LLMs thường được huấn luyện theo cách thưởng cho việc đoán câu trả lời hơn là thừa nhận không chắc chắn. Điều này khiến mô hình học cách “fake it till you make it.”

  • Các mô hình như Claude của Anthropic được ghi nhận là “nhận thức rõ sự không chắc chắn hơn” và thường từ chối khi không chắc chắn, nhưng điều đó lại khiến tỷ lệ “refusal” cao, hạn chế tính hữu dụng.

  • Nguyên nhân sâu xa: đa số các bài kiểm tra và tiêu chí đánh giá hiện tại thưởng cho sự chính xác tuyệt đối và phạt việc bỏ qua, từ đó buộc mô hình “ở chế độ làm bài thi” liên tục, coi mọi câu hỏi như đúng/sai tuyệt đối.

  • Nghiên cứu chỉ ra rằng mô hình không được thiết kế để xử lý những tình huống thực tế – nơi sự mơ hồ và không chắc chắn phổ biến hơn.

  • OpenAI so sánh: con người học cách thừa nhận sự không chắc chắn từ “trường đời”, nhưng mô hình lại chỉ được đánh giá dựa trên bài thi, nên học cách đoán để đạt điểm cao.

  • Giải pháp đề xuất: thay đổi cách chấm điểm trong các tiêu chí đánh giá (evals), loại bỏ việc phạt khi mô hình chọn “không trả lời.” Nếu bảng xếp hạng tiếp tục thưởng cho đoán mò, mô hình sẽ duy trì thói quen này.

  • OpenAI nhấn mạnh cần cập nhật các “accuracy-based evals” để khuyến khích mô hình thể hiện sự thận trọng thay vì tự tin sai lầm.

  • Nghiên cứu được công bố hôm thứ Năm, nhưng OpenAI chưa đưa ra phản hồi chính thức về nội dung này với báo chí.


📌 OpenAI phát hiện nguyên nhân chính của hiện tượng “ảo giác” trong chatbot: chúng được thưởng cho đoán mò thay vì thừa nhận không chắc chắn. GPT-5 và các LLM khác vì vậy luôn “trong chế độ làm bài thi,” trả lời mọi thứ như đúng-sai tuyệt đối. Giải pháp là cải cách tiêu chí đánh giá, ngừng phạt việc từ chối trả lời, từ đó giảm ảo giác và nâng cao độ tin cậy của AI.

https://www.businessinsider.com/why-ai-chatbots-hallucinate-openai-chatgpt-anthropic-claude-2025-9

Không có file đính kèm.

17

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo