MÔ HÌNH CHATGPT VƯỢT QUA NĂNG LỰC CON NGƯỜI TRONG BÀI KIỂM TRA THẦN KINH HỌC

- Hai mô hình AI ChatGPT đã vượt qua sinh viên ngành thần kinh học trong kỳ thi lấy bằng, với mô hình thứ hai đạt tỷ lệ thành công ấn tượng lên đến 85%.

- Nghiên cứu này được công bố trên JAMA Network Open, không cho phép hai mô hình AI truy cập internet hay được tinh chỉnh đặc biệt về ngành thần kinh học.

- Các mô hình AI đó là LLM 1 (ChatGPT phiên bản 3.5) và LLM 2 (ChatGPT phiên bản 4), chúng đã làm bài kiểm tra từ ngân hàng câu hỏi của American Board of Psychiatry and Neurology (ABPN).

- Kết quả cho thấy LLM 2 vượt trội so với mức trung bình của con người là 73.8%, đặc biệt là trong các câu hỏi yêu cầu phân tích và đánh giá cao cấp.

- Phát hiện này nhấn mạnh tiềm năng của AI trong lĩnh vực y tế, đặc biệt là cho các nhiệm vụ liên quan đến trí nhớ và phân tích.

- Tuy nhiên, các tác giả của nghiên cứu cũng chỉ ra rằng AI có thể đóng vai trò bổ trợ chứ không thay thế hoàn toàn sự chuyên môn của con người trong lĩnh vực y tế nhạy cảm.

 

Các phát hiện từ nghiên cứu đăng trên JAMA Network Open cho thấy bước tiến lớn trong khả năng của AI, đặc biệt là trong lĩnh vực y học nói chung và thần kinh học nói riêng. Mô hình LLM 2 của ChatGPT đã đạt được 85% thành công trong bài thi, vượt qua mức trung bình của con người là 73.8%. Kết quả này không chỉ mở ra hướng mới trong giáo dục và thực hành y tế mà còn phản ánh nhu cầu không ngừng đánh giá và điều chỉnh hệ thống AI để chúng có thể hỗ trợ hiệu quả cho chuyên môn y tế của con người.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo