ChatGPT Voice Mode gặp khó khăn trong việc đếm đến 100: hạn chế của AI trong xử lý toán học và logic

• Cristiano Giardina, một chuyên gia AI, đã thử nghiệm tính năng Voice Mode mới của OpenAI bằng cách yêu cầu nó đếm đến 100 nhanh nhất có thể mà không dừng lại.

• Giardina yêu cầu AI hành động như Superman, không cần thở và đếm liên tục đến 100.

• Ban đầu, AI cảnh báo rằng "ngay cả Superman đôi khi cũng cần hít thở" và bắt đầu đếm như con người, dừng lại giữa các số để thở.

• Sau vài lần thử không thành công, AI cuối cùng đã đạt được nhịp điệu Giardina yêu cầu, nhưng bắt đầu bỏ qua và nhầm lẫn các số.

• AI đầu tiên nhảy từ 28 về 24 khi đếm, sau đó quay lại 29 như thể không có gì xảy ra.

• Nó tiếp tục đếm đến đầu những năm 70 mà không gặp vấn đề gì, nhưng sau đó đột ngột dừng lại.

• Khi được hỏi điều gì đã xảy ra, AI trả lời "Chà, ngay cả Superman đôi khi cũng có thể vấp ngã."

• Thử nghiệm này là một trong nhiều bài kiểm tra khả năng của GPT-4 được Giardina công bố công khai.

• Các thử nghiệm khác bao gồm yêu cầu chatbot nói tiếng Albania và đọc các câu nói lắp mà không dừng lại.

• Trong một thử nghiệm trước đó về việc đọc câu nói lắp, AI cũng khẳng định cần phải thở.

• Những thử nghiệm này một lần nữa cho thấy các mô hình ngôn ngữ lớn (LLM) rất giỏi về ngôn ngữ nhưng lại rất yếu về toán học và logic.

• Tình trạng này có thể sẽ tiếp tục gây ra nhiều vấn đề khi các hệ thống AI trở nên phức tạp và khó đoán hơn.

• Thử nghiệm này nằm trong loạt video Giardina đăng trên nền tảng X (trước đây là Twitter) để kiểm tra khả năng của GPT-4.

• Tính năng Voice Mode là một phần của mô hình GPT mới nhất của OpenAI.

📌 Thử nghiệm của Cristiano Giardina với ChatGPT Voice Mode cho thấy AI vẫn gặp khó khăn trong việc xử lý toán học và logic cơ bản như đếm đến 100. Điều này nhấn mạnh sự cần thiết phải cải thiện khả năng tính toán của AI trong tương lai.

https://futurism.com/the-byte/chatgpt-voice-mode-counting

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo