AI tạo sinh và thách thức trích dẫn nguồn: liệu có đe dọa tương lai báo chí?

• Các mô hình AI tạo sinh như ChatGPT đang gặp khó khăn trong việc trích dẫn nguồn một cách chính xác và đáng tin cậy. Ngay cả khi đạt được độ chính xác 70-80%, việc đạt tới 99% vẫn còn là một thách thức lớn.

• Để cung cấp thông tin cập nhật, các chatbot thường sử dụng phương pháp tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG). Tuy nhiên, quá trình này dễ gặp lỗi ở nhiều bước, từ tìm kiếm internet không chính xác đến việc AI diễn giải sai thông tin thu thập được.

• Các mô hình ngôn ngữ lớn được thiết kế để viết văn trôi chảy bằng cách dự đoán từ, không phải để kiểm chứng thông tin hay tạo chú thích. Điều này dẫn đến hiện tượng "ảo giác", khi AI tạo ra thông tin không có thật.

• OpenAI đã ký thỏa thuận cấp phép với nhiều công ty truyền thông lớn như The Wall Street Journal, The Atlantic... để sử dụng nội dung của họ. Tuy nhiên, khả năng trích dẫn chính xác của ChatGPT vẫn còn hạn chế.

• Trong các thử nghiệm, ChatGPT thường không cung cấp liên kết đến nguồn gốc, hoặc đưa ra liên kết không hoạt động. Nó cũng có xu hướng trích dẫn các nguồn thứ cấp thay vì nguồn gốc ban đầu.

Perplexity, một công cụ tìm kiếm AI khác, cũng gặp vấn đề tương tự nhưng ít lỗi hơn ChatGPT. Tuy nhiên, Perplexity đã bị cáo buộc đạo văn nội dung của các nhà báo.

Các chuyên gia cho rằng việc tạo ra một hệ thống AI có thể trích dẫn nguồn một cách đáng tin cậy là một thách thức lớn. Nó đòi hỏi sự cân bằng giữa khả năng tổng hợp thông tin và độ trung thực với nguồn gốc.

• Mặc dù các công ty AI hứa hẹn sẽ cải thiện khả năng trích dẫn và tăng lượng độc giả cho các đối tác truyền thông, vẫn chưa rõ liệu họ có thể thực hiện được điều này một cách nhất quán hay không.

• Vấn đề này không hoàn toàn mới. Các trang web do con người vận hành cũng thường xuyên tổng hợp và sử dụng lại nội dung gốc. Tuy nhiên, quy mô và tốc độ của AI có thể làm trầm trọng thêm vấn đề này.

📌 AI tạo sinh như ChatGPT và Perplexity đang gặp khó khăn trong việc trích dẫn nguồn chính xác, với độ chính xác chỉ đạt 70-80%. Điều này đặt ra thách thức lớn cho tương lai của báo chí, khi các công ty công nghệ hứa hẹn tăng lượng độc giả nhưng vẫn chưa thể đảm bảo tính minh bạch và đáng tin cậy trong việc trích dẫn nguồn.

https://www.theatlantic.com/technology/archive/2024/06/chatgpt-citations-rag/678796/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo