Nhiều nhà khoa học như Timothée Poisot lo ngại về việc AI can thiệp vào bình duyệt học thuật sau khi nhận ra một phản hồi từ hội đồng bình duyệt dường như được viết bằng AI, với các câu đặc trưng như "đây là phiên bản cải thiện của bình duyệt của bạn".
Dù một số tạp chí cấm sử dụng AI trong bình duyệt, nhiều nhà nghiên cứu và nhà xuất bản vẫn âm thầm hoặc công khai sử dụng AI để kiểm lỗi, cải thiện văn phong, và hướng dẫn bình duyệt.
Các hệ thống AI, đặc biệt là các mô hình ngôn ngữ lớn (LLMs), như GPT-4, ngày càng được tích hợp vào quy trình bình duyệt để tăng tốc độ, độ chính xác và hiệu quả.
Theo khảo sát gần 5.000 nhà nghiên cứu do Wiley thực hiện, 19% đã từng sử dụng LLMs để hỗ trợ việc bình duyệt — tuy nhiên, mức độ sử dụng toàn phần hay chỉ hỗ trợ chưa được phân tích rõ.
Một nghiên cứu giai đoạn 2023–2024 cho thấy từ 7% đến 17% các bản bình duyệt cho hội thảo AI có dấu hiệu được chỉnh sửa nhiều bởi LLMs.
Mối lo lớn là việc rò rỉ dữ liệu khi sử dụng các chatbot AI trực tuyến; vì vậy, một số chuyên gia như Sebastian Porsdam Mann đề xuất dùng LLMs offline để giữ bảo mật.
Nhiều chuyên gia như Carl Bergstrom cảnh báo rằng nếu AI viết gần như toàn bộ bình duyệt, chất lượng và chiều sâu phân tích sẽ giảm. Ông nhấn mạnh “viết chính là quá trình tư duy”.
Một nghiên cứu tại Mỹ với hơn 300 nhà nghiên cứu cho thấy 40% đánh giá phản hồi từ GPT-4 hữu ích hơn hoặc tương đương bình duyệt của con người; 42% đánh giá AI kém hơn nhiều người, nhưng vẫn hơn một số người.
Nhiều công cụ AI mới như Eliza, Review Assistant, Veracity, Alchemist Review đang được phát triển để hỗ trợ, không thay thế người bình duyệt. Chúng có khả năng kiểm tra trích dẫn, dịch ngôn ngữ, phát hiện lỗi logic, và gợi ý cải thiện phản hồi.
Các nhà xuất bản như AIP Publishing đang thử nghiệm Alchemist Review ở giai đoạn tiền bình duyệt, nhấn mạnh rằng AI không thay thế người mà chỉ hỗ trợ biên tập viên và bình duyệt viên.
Một số công cụ mạnh hơn như Paper-Wizard tạo cả bản bình duyệt nhiều trang khi người dùng tải lên bản thảo — công cụ này được thiết kế để tác giả tự đánh giá trước khi nộp.
Tại thời điểm cuối năm 2024, 59% trong 78 tạp chí y học hàng đầu cấm sử dụng AI trong bình duyệt, trong khi phần còn lại cho phép với điều kiện cụ thể, đặc biệt là không được tải bản thảo lên nền tảng công cộng.
Một số chuyên gia như Chris Leonard và Jason Priem tin rằng trong vòng 1–5 năm, AI có thể vượt mặt con người trong bình duyệt về tốc độ và chất lượng.
Tuy nhiên, các chuyên gia về đạo đức nghiên cứu như Mohammad Hosseini cảnh báo về tương lai "buồng dội âm" khi AI vừa viết vừa bình duyệt nghiên cứu — một viễn cảnh có thể làm xói mòn vai trò của các tạp chí khoa học.
Một đề xuất thực tế hơn là để AI đánh giá sơ bộ các bản thảo, tóm tắt và phân loại trước khi con người đưa ra quyết định bình duyệt tiếp theo.
📌 AI đang định hình lại quá trình bình duyệt khoa học: 19% nhà khoa học từng sử dụng AI hỗ trợ, từ 7–17% bình duyệt đã bị chỉnh sửa bởi LLMs. Công cụ như Eliza, Alchemist Review, Paper-Wizard hứa hẹn tăng tốc quy trình nhưng gây lo ngại về tính chính xác, bảo mật và vai trò của con người. Dù có tiềm năng hỗ trợ đáng kể, cộng đồng khoa học cần minh bạch, tiêu chuẩn rõ ràng để kiểm soát làn sóng AI tạo sinh đang lan rộng.
https://www.nature.com/articles/d41586-025-00894-7
#NATURE