- Nghiên cứu phân tích 200 báo cáo X-quang, trong đó 100 báo cáo có lỗi cố ý và 100 báo cáo chính xác. Sáu bác sĩ X-quang và GPT-4 đánh giá các báo cáo này để tìm lỗi.
- Không có sự khác biệt đáng kể về tỷ lệ phát hiện lỗi trung bình giữa GPT-4 và bác sĩ X-quang, ngoại trừ một số trường hợp cụ thể như nhầm lẫn bên trái/phải.
- GPT-4 chỉ mất 0.19 giờ để xem xét tất cả 200 báo cáo, so với 1.4 đến 5.74 giờ của bác sĩ X-quang. GPT-4 đọc mỗi báo cáo trong 3.5 giây, trong khi bác sĩ nhanh nhất mất trung bình 25.1 giây.
- Tổng chi phí trung bình để 6 bác sĩ kiểm tra 200 báo cáo là 190.17 đô la, trong khi GPT-4 chỉ tốn 5.78 đô la. Chi phí mỗi báo cáo với GPT-4 là 0.03 đô la, so với 0.96 đô la của bác sĩ.
📌 GPT-4 thể hiện khả năng phát hiện lỗi trong báo cáo X-quang tương đương với bác sĩ, đồng thời tiết kiệm đáng kể về thời gian (0,19 giờ so với 1,4 đến 5,74 giờ) và chi phí (0,03 đô la/báo cáo so với 0,96 đô la). Tuy nhiên, sự giám sát của con người vẫn cần thiết vì các vấn đề pháp lý và độ chính xác.
Citations:
[1] https://www.news-medical.net/news/20240417/GPT-4-matches-radiologist-accuracy-in-spotting-errors-cuts-time-and-costs-dramatically.aspx