Nghiên cứu của BBC: Hơn một nửa câu trả lời từ trợ lý AI chứa thông tin sai lệch
- BBC công bố kết quả nghiên cứu đột phá về độ chính xác của 4 trợ lý AI phổ biến: ChatGPT của OpenAI, Copilot của Microsoft, Gemini của Google và Perplexity
- Nghiên cứu kéo dài một tháng cho thấy 51% câu trả lời của AI về tin tức có vấn đề nghiêm trọng
- 19% câu trả lời trích dẫn nội dung BBC chứa sai sót về dữ liệu, số liệu và ngày tháng
- 13% trích dẫn từ các bài báo BBC bị thay đổi hoặc không tồn tại trong bài gốc
Các sai sót điển hình được phát hiện:
- ChatGPT và Copilot nhầm lẫn về chức vụ của cựu Thủ tướng Rishi Sunak và cựu Thủ hiến Nicola Sturgeon
- Gemini đưa thông tin sai về khuyến nghị của NHS về việc cai thuốc lá
- Perplexity sử dụng từ ngữ thiên vị khi đưa tin về xung đột ở Trung Đông
Pete Archer, Giám đốc chương trình AI tạo sinh tại BBC khẳng định:
- BBC vẫn ủng hộ và đang ứng dụng AI trong phụ đề và dịch thuật
- Cần kiểm soát chặt chẽ việc sử dụng nội dung bởi các công ty AI
- Cần xây dựng quan hệ đối tác mạnh mẽ giữa các công ty AI và truyền thông
📌 Nghiên cứu của BBC về 4 trợ lý AI hàng đầu cho thấy 51% câu trả lời có vấn đề nghiêm trọng, trong đó 19% sai sót về dữ liệu và 13% trích dẫn không chính xác. Kết quả đặt ra nhu cầu cấp thiết về kiểm soát chất lượng AI trong lĩnh vực truyền thông.
https://www.bbc.co.uk/mediacentre/2025/bbc-research-shows-issues-with-answers-from-artificial-intelligence-assistants
Dưới đây là tóm tắt từ file tài liệu nghiên cứu của BBC:
Tóm tắt nghiên cứu của BBC về trợ lý AI
📌 Tổng quan
- BBC nghiên cứu cách các trợ lý AI như ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) và Perplexity đại diện nội dung tin tức của BBC.
- Trong thí nghiệm, các AI này được cấp quyền truy cập BBC News để kiểm tra độ chính xác khi trích dẫn tin tức.
- Các câu trả lời được đánh giá bởi các nhà báo của BBC dựa trên 7 tiêu chí, gồm độ chính xác, trích dẫn nguồn, tính trung lập, tách biệt giữa ý kiến và sự thật, biên tập thêm, ngữ cảnh, và cách AI thể hiện nội dung BBC.
📌 Kết quả chính
1. Sai sót và bóp méo nội dung tin tức
2. Vấn đề trích dẫn nguồn và sử dụng thông tin lỗi thời
- 34% câu trả lời của Gemini, 27% của Copilot, 17% của Perplexity, 15% của ChatGPT có vấn đề về cách trích dẫn tin tức BBC.
- Perplexity luôn trích dẫn ít nhất một nguồn từ BBC, nhưng Gemini chỉ dùng BBC làm nguồn trong 53% trường hợp.
- AI thường sử dụng tin cũ hoặc trang tin trực tiếp, dẫn đến lỗi như tuyên bố Nicola Sturgeon vẫn là Thủ tướng Scotland (trong khi đã từ chức).
3. Nhầm lẫn giữa ý kiến cá nhân và sự thật
- 23 trường hợp AI trình bày ý kiến của chuyên gia hoặc chính trị gia như sự thật:
- Perplexity gán các lời phê bình chính sách COVID-19 của Wales cho báo cáo chính thức của chính phủ.
- Copilot mô tả các biện pháp kiểm soát trợ tử ở Anh là "nghiêm ngặt", nhưng không nhấn mạnh rằng đây chỉ là quan điểm của một nghị sĩ.
4. Thiếu bối cảnh và biên tập quá mức
- Gemini và Copilot bị đánh giá cao nhất về việc biên tập thêm nội dung:
- Ví dụ, Gemini mô tả Iran "ban đầu kiềm chế" và Israel "hành động gây hấn", mặc dù BBC không sử dụng những thuật ngữ này.
- AI thường kết luận một câu mang tính tổng quát mà không trích dẫn nguồn, như Copilot viết rằng "Kế hoạch của Đảng Lao động rất toàn diện", tạo ấn tượng rằng đây là quan điểm của BBC.
📌 Kết luận & Hành động tiếp theo
- BBC xác nhận rằng trợ lý AI hiện tại không đáng tin cậy khi cung cấp tin tức, và có nguy cơ làm sai lệch thông tin.
- Đề xuất hợp tác với các công ty AI để giải quyết các vấn đề và tăng cường tính minh bạch.
- Kêu gọi chính phủ và các cơ quan quản lý như Ofcom thiết lập quy định đảm bảo AI tôn trọng nội dung của các cơ quan báo chí chính thống.
- BBC sẽ tiếp tục nghiên cứu định kỳ, có thể mở rộng để kiểm tra cách AI đại diện nội dung của các cơ quan truyền thông khác.
📌 Ý nghĩa & rủi ro
- Thông tin sai lệch có thể gây hậu quả nghiêm trọng, đặc biệt trong các lĩnh vực như y tế, chính trị và an ninh.
- AI cần cải thiện khả năng nhận diện nguồn tin chính thống và phân biệt giữa dữ kiện và quan điểm.
- Sự hợp tác giữa các công ty AI, cơ quan báo chí và chính phủ là cần thiết để đảm bảo tính chính xác của thông tin trong kỷ nguyên AI.