Bất ngờ: GPT-4 vượt trội bác sĩ trong chẩn đoán, nhưng bác sĩ dùng GPT-4 lại không cải thiện!

• Một nghiên cứu mới so sánh độ chính xác chẩn đoán giữa bác sĩ sử dụng nguồn thông tin thông thường, bác sĩ sử dụng GPT-4 và GPT-4 độc lập.

• Kết quả cho thấy GPT-4 đạt điểm lý luận chẩn đoán ấn tượng 92,1% khi sử dụng độc lập. Bác sĩ chỉ sử dụng nguồn thông tin thông thường đạt điểm trung bình 73,7%, trong khi bác sĩ sử dụng GPT-4 đạt điểm cao hơn một chút là 76,3%.

Về độ chính xác chẩn đoán cuối cùng, GPT-4 đưa ra chẩn đoán đúng trong 66% trường hợp, so với 62% của các bác sĩ. Tuy nhiên, sự khác biệt này không có ý nghĩa thống kê.

• "Lý luận chẩn đoán" được định nghĩa là đánh giá toàn diện quá trình tư duy của bác sĩ, bao gồm đưa ra chẩn đoán phân biệt, xác định các yếu tố ủng hộ hoặc phản đối từng chẩn đoán tiềm năng và xác định các bước chẩn đoán tiếp theo.

• Nghiên cứu sử dụng công cụ "phản ánh có cấu trúc" để đánh giá quá trình này, chấm điểm người tham gia dựa trên khả năng đưa ra chẩn đoán hợp lý, xác định chính xác các phát hiện ủng hộ và phản đối, và lựa chọn đánh giá tiếp theo phù hợp.

Có nhiều rào cản khiến bác sĩ sử dụng mô hình ngôn ngữ lớn như GPT-4 gặp khó khăn trong việc cải thiện chẩn đoán:

1. Vấn đề về niềm tin và sự phụ thuộc: Bác sĩ có thể hoài nghi về đề xuất của AI, đặc biệt nếu không phù hợp với trực giác lâm sàng của họ.

2. Kỹ năng tạo prompt: Bác sĩ có thể chưa được đào tạo cách tương tác hiệu quả với GPT-4, dẫn đến câu hỏi không tối ưu và phản hồi ít liên quan.

3. Tải trọng nhận thức và tích hợp quy trình làm việc: Việc sử dụng AI có thể tạo thêm gánh nặng nhận thức, đặc biệt trong môi trường lâm sàng bận rộn.

4. Sự khác biệt trong cách tiếp cận chẩn đoán: Bác sĩ dựa vào đánh giá lâm sàng tinh tế, trong khi AI giỏi nhận dạng mẫu và tổng hợp dữ liệu.

Để cải thiện hợp tác giữa con người và AI trong y tế, cần giải quyết các vấn đề về nhận thức và chức năng trong quá trình hợp tác bác sĩ-AI.

• Cần đào tạo, cải tiến giao diện người dùng và xây dựng niềm tin vào khả năng của AI để tích hợp hiệu quả vào quá trình lý luận lâm sàng.

📌 GPT-4 đạt điểm lý luận chẩn đoán 92,1%, vượt trội so với bác sĩ (73,7%). Tuy nhiên, bác sĩ sử dụng GPT-4 chỉ cải thiện nhẹ lên 76,3%. Nguyên nhân có thể do sự hoài nghi, thiếu kỹ năng tương tác AI và khác biệt trong cách tiếp cận. Cần đào tạo, cải tiến giao diện và xây dựng niềm tin để tích hợp AI hiệu quả hơn trong y tế.

https://www.psychologytoday.com/us/blog/the-digital-self/202410/the-cognitive-disconnect-between-physicians-and-ai-0

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo