Báo cáo của ODI năm 2024: Chỉ sổ minh bạch dữ liệu AI (AIDTI) của 22 mô hình
- Báo cáo của Open Data Institute (ODI) năm 2024 tập trung vào việc xây dựng chỉ số AI Data Transparency Index (AIDTI) để đánh giá mức độ minh bạch dữ liệu trong phát triển AI.
- Chỉ số AIDTI dựa trên nhu cầu minh bạch từ hai nhóm chính: các nhà phát triển và các nhà nghiên cứu AI có trách nhiệm (RAI). Báo cáo đánh giá 7 khía cạnh minh bạch, bao gồm nguồn gốc dữ liệu, phương pháp thu thập, tiền xử lý, tác động môi trường, và chuỗi cung ứng nhân sự.
- Trong số 22 mô hình AI được đánh giá:
- 5 mô hình đạt mức "cao" về minh bạch.
- 6 mô hình đạt mức "trung bình".
- 11 mô hình chỉ đạt mức "thấp".
- Báo cáo chỉ ra rằng các mô hình có mức minh bạch cao thường công bố rõ ràng về nguồn dữ liệu và áp dụng các tiêu chuẩn nhất quán như thẻ mô hình (model cards) từ Hugging Face.
- Các lĩnh vực bị đánh giá thấp bao gồm thông tin về chuỗi cung ứng nhân sự và việc sử dụng dữ liệu cá nhân hoặc bản quyền trong quá trình đào tạo.
- Chỉ 9 trong số 22 mô hình cung cấp thông tin về tác động môi trường, mặc dù đây là vấn đề ngày càng nhận được sự quan tâm.
- Các nhà phát triển gặp khó khăn trong việc cung cấp thông tin toàn diện do chi phí cao và sự phức tạp của chuỗi cung ứng AI toàn cầu.
- Báo cáo khuyến nghị:
- Xây dựng tiêu chuẩn vàng để đáp ứng nhu cầu đa dạng của người dùng.
- Tiếp tục thúc đẩy quy định và chuẩn hóa yêu cầu minh bạch.
- Mở rộng nghiên cứu và cải thiện chất lượng thông tin minh bạch.
- Tăng cường áp dụng minh bạch không chỉ trong phát triển mà cả triển khai và giám sát hệ thống AI.
- Báo cáo cũng hướng tới việc tạo ra hệ thống minh bạch tương tác, hỗ trợ dữ liệu đọc máy, giúp các bên liên quan dễ dàng truy cập thông tin minh bạch hơn.
📌 ODI nhấn mạnh tính cấp thiết của minh bạch dữ liệu AI để đảm bảo trách nhiệm và tin cậy trong hệ sinh thái AI. Chỉ số AIDTI đánh giá 22 mô hình, tiết lộ nhiều thiếu sót và đề xuất cải thiện qua nghiên cứu, tiêu chuẩn hóa, và áp dụng hệ thống hỗ trợ tương tác.
https://theodi.cdn.ngo/media/documents/Building_a_user-centric_AI_data_transparency_approach.pdf