• Ahmed Abdeen Hamed, nghiên cứu viên tại Đại học Binghamton, đã tạo ra thuật toán máy học xFakeSci có thể phát hiện tới 94% bài báo khoa học giả mạo.
• xFakeSci hiệu quả gấp đôi so với các kỹ thuật khai thác dữ liệu thông thường trong việc phát hiện bài giả.
• Nghiên cứu được công bố trên tạp chí Scientific Reports, so sánh 50 bài viết giả và 50 bài thật về 3 chủ đề y học phổ biến: Alzheimer, ung thư và trầm cảm.
• Thuật toán phân tích 2 đặc điểm chính trong cách viết bài: số lượng bigram (cặp từ thường xuất hiện cùng nhau) và cách chúng liên kết với các từ và khái niệm khác trong văn bản.
• Kết quả cho thấy bài giả có ít bigram hơn nhưng lại kết nối nhiều với các phần khác của văn bản.
• Lý do là AI như ChatGPT cố gắng thuyết phục bằng cách sử dụng các từ quan trọng nhất, trong khi bài thật tập trung vào báo cáo trung thực về phương pháp và kết quả nghiên cứu.
• Hamed dự định mở rộng phạm vi chủ đề để kiểm tra tính hiệu quả của thuật toán, bao gồm kỹ thuật và nhân văn.
• Ông cũng nhận thấy AI ngày càng tinh vi hơn, nên việc phân biệt thật-giả sẽ ngày càng khó khăn.
• Mặc dù đạt độ chính xác 94%, nhưng vẫn còn 6% bài giả không bị phát hiện. Cần tiếp tục cải thiện thuật toán.
• Nghiên cứu này góp phần nâng cao nhận thức về vấn đề bài báo khoa học giả mạo do AI tạo ra.
📌 Thuật toán xFakeSci phát hiện 94% bài báo khoa học giả mạo bằng cách phân tích bigram và liên kết từ. Nghiên cứu mở ra hướng phát triển công cụ toàn diện hơn để chống lại tin giả trong khoa học, đặc biệt khi AI ngày càng tinh vi.
https://techxplore.com/news/2024-08-tool-fake-ai-scientific-articles.html