Các công ty AI tuyên bố mô hình của họ có khả năng lập luận thực sự như con người khi giải quyết vấn đề
Mô hình "lập luận" tiên tiến như OpenAI o1 và DeepSeek r1 được thiết kế để "suy nghĩ" trước khi trả lời bằng cách chia nhỏ vấn đề và giải quyết từng bước
Các mô hình này có thể giải các câu đố logic phức tạp, đạt điểm cao trong bài kiểm tra toán và viết mã không lỗi ngay lần đầu
Tuy nhiên chúng vẫn thất bại với những câu hỏi đơn giản như "có bao nhiêu chữ 'r' trong từ 'strawberry'"
Các chuyên gia hoài nghi cho rằng AI chỉ đang bắt chước quá trình suy nghĩ của con người thay vì thực sự lập luận
Nhóm ủng hộ AI cho rằng các mô hình đang thực hiện một số hình thức lập luận, dù chưa linh hoạt như con người
Melanie Mitchell từ Viện Santa Fe nhấn mạnh khả năng tổng quát hóa là yếu tố quan trọng của lập luận mà AI còn thiếu
Ryan Greenblatt từ Redwood Research tin rằng AI đang thực hiện một số hình thức lập luận, kết hợp giữa ghi nhớ và suy luận
Khái niệm "trí thông minh gồ ghề" được đưa ra để mô tả việc AI có thể giải quyết các vấn đề phức tạp nhưng lại gặp khó với những việc đơn giản
Các chuyên gia khuyến nghị sử dụng AI trong các tình huống dễ kiểm chứng kết quả như viết mã, thiết kế website và thận trọng với các vấn đề đạo đức hoặc có rủi ro cao
📌 AI hiện có "trí thông minh gồ ghề" - vừa xuất sắc ở một số lĩnh vực phức tạp như giải toán, lập trình nhưng lại yếu ở những việc đơn giản. Các chuyên gia đề xuất coi AI như đối tác tư duy thay vì một nguồn tri thức tuyệt đối, đặc biệt trong các vấn đề cần phán đoán và đạo đức.
https://www.vox.com/future-perfect/400531/ai-reasoning-models-openai-deepseek