ChatGPT ngày càng “bịa chuyện”: Tỷ lệ ảo giác của AI mới tăng gấp 3 lần

  • OpenAI vừa công bố báo cáo về các thử nghiệm nội bộ với 2 mô hình ChatGPT mới: o3 và o4-mini, nổi bật nhờ khả năng suy luận nâng cao và đa phương thức.

  • o3 và o4-mini có thể tạo ảnh, tìm kiếm web, tự động hóa tác vụ, ghi nhớ hội thoại cũ và giải quyết vấn đề phức tạp, nhưng đồng thời xuất hiện tác dụng phụ không mong muốn: tỷ lệ ảo giác (hallucination) tăng mạnh.

  • Bài kiểm tra PersonQA của OpenAI đo tỷ lệ ảo giác dựa trên độ chính xác khi trả lời câu hỏi về một tập dữ liệu người dùng cụ thể. Năm ngoái, mô hình o1 đạt độ chính xác 47% và tỷ lệ ảo giác 16%.

  • Khi thử nghiệm, o4-mini có tỷ lệ ảo giác lên tới 48%, rất cao dù là sản phẩm thương mại. o3 cũng ảo giác 33%, gấp đôi so với o1, dù độ chính xác cũng cao hơn.

  • Ảo giác AI là hiện tượng mô hình “bịa” ra thông tin không có nguồn gốc, thường xảy ra khi không tìm được dữ liệu phù hợp để trả lời.

  • Lý do dẫn đến ảo giác tăng chưa rõ ràng, có thể do mô hình nhỏ hơn (như o4-mini) thiếu kiến thức nền tảng hoặc do quá trình huấn luyện ưu tiên trả lời tự tin thay vì thừa nhận “không biết”.

  • OpenAI thừa nhận chưa có giải pháp triệt để, có thể cần kết hợp nhiều mô hình AI và hệ thống kiểm chứng chéo để giảm ảo giác.

  • Người dùng được khuyến cáo luôn kiểm tra lại thông tin do AI tạo sinh cung cấp, vì tỷ lệ ảo giác tăng đồng nghĩa nguy cơ bị sai lệch thông tin cũng tăng.

📌 ChatGPT phiên bản mới o3 và o4-mini có tỷ lệ ảo giác cao đột biến: o4-mini lên tới 48%, o3 là 33%, so với o1 chỉ 16%. OpenAI chưa tìm ra nguyên nhân, khuyến nghị người dùng phải kiểm chứng mọi thông tin do AI tạo sinh cung cấp để tránh bị dẫn dắt sai.

 

https://www.digitaltrends.com/computing/chatgpt-models-hallucinate-more-now/

Không có file đính kèm.

16

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo