• Nghiên cứu mới được công bố trên tạp chí Nature Medicine đã đánh giá việc sử dụng dữ liệu nhân khẩu học trong các mô hình AI y tế và tác động của nó đến tính công bằng của kết quả.
• Các mô hình học sâu trong chẩn đoán hình ảnh y tế đã đạt được thành công đáng kể, nhưng thường kế thừa các thiên lệch từ dữ liệu đào tạo, dẫn đến sự chênh lệch về hiệu suất giữa các nhóm dân số khác nhau.
• Nghiên cứu tập trung vào các tác vụ phân loại nhị phân liên quan đến hình ảnh X-quang ngực, bao gồm các danh mục như "Không có phát hiện", "Tràn dịch", "Tràn khí màng phổi" và "Bệnh tim to", sử dụng các bộ dữ liệu như MIMIC-CXR và CheXpert.
• Các tác vụ về da liễu sử dụng bộ dữ liệu ISIC cho phân loại "Không có phát hiện", trong khi các tác vụ về nhãn khoa được đánh giá bằng bộ dữ liệu ODIR, tập trung vào "Bệnh võng mạc".
• Các chỉ số đánh giá tính công bằng bao gồm tỷ lệ dương tính giả (FPR) và tỷ lệ âm tính giả (FNR), nhấn mạnh việc cân bằng odds để đo lường sự chênh lệch hiệu suất giữa các nhóm nhân khẩu học.
• Nghiên cứu phát hiện ra rằng việc mã hóa thông tin nhân khẩu học có thể hoạt động như "lối tắt" và ảnh hưởng đáng kể đến tính công bằng, đặc biệt là trong các tình huống phân phối thay đổi.
• Loại bỏ các "lối tắt" này có thể cải thiện tính công bằng trong phân phối (ID) nhưng không nhất thiết dẫn đến tính công bằng tốt hơn ngoài phân phối (OOD).
• Có sự đánh đổi giữa tính công bằng và các chỉ số có ý nghĩa lâm sàng khác. Tính công bằng đạt được trong môi trường ID có thể không duy trì trong các tình huống OOD.
• Nghiên cứu nhấn mạnh sự cần thiết của việc giám sát liên tục các mô hình AI trong môi trường lâm sàng để giải quyết vấn đề suy giảm tính công bằng.
• Các tác giả thảo luận về sự phức tạp của việc đưa các đặc điểm nhân khẩu học vào mô hình, nhấn mạnh rằng một số có thể là yếu tố nguyên nhân của một số bệnh, trong khi những yếu tố khác có thể là đại diện gián tiếp.
• Nghiên cứu cũng chỉ ra những hạn chế của các định nghĩa công bằng hiện tại và khuyến khích các nhà thực hành chọn các chỉ số công bằng phù hợp với trường hợp sử dụng cụ thể của họ.
📌 Nghiên cứu nhấn mạnh sự cần thiết của các chiến lược debiasing hiệu quả, giám sát liên tục và lựa chọn mô hình cẩn thận để đảm bảo hệ thống AI y tế đáng tin cậy và công bằng. Cần có cách tiếp cận tinh vi về tính công bằng, phát triển các mô hình không chỉ tốt về mặt kỹ thuật mà còn đúng đắn về mặt đạo đức và phù hợp với môi trường lâm sàng thực tế.
https://www.marktechpost.com/2024/08/08/ai-in-medical-imaging-balancing-performance-and-fairness-across-populations/