AI deepfake-ảo giác-ANTT 2025-02-12 00:25:35

Nghiên cứu của BBC: Hơn một nửa câu trả lời từ trợ lý AI chứa thông tin sai lệch

- BBC công bố kết quả nghiên cứu đột phá về độ chính xác của 4 trợ lý AI phổ biến: ChatGPT của OpenAI, Copilot của Microsoft, Gemini của Google và Perplexity

- Nghiên cứu kéo dài một tháng cho thấy 51% câu trả lời của AI về tin tức có vấn đề nghiêm trọng

- 19% câu trả lời trích dẫn nội dung BBC chứa sai sót về dữ liệu, số liệu và ngày tháng

- 13% trích dẫn từ các bài báo BBC bị thay đổi hoặc không tồn tại trong bài gốc

Các sai sót điển hình được phát hiện:
- ChatGPT và Copilot nhầm lẫn về chức vụ của cựu Thủ tướng Rishi Sunak và cựu Thủ hiến Nicola Sturgeon
- Gemini đưa thông tin sai về khuyến nghị của NHS về việc cai thuốc lá
- Perplexity sử dụng từ ngữ thiên vị khi đưa tin về xung đột ở Trung Đông

Pete Archer, Giám đốc chương trình AI tạo sinh tại BBC khẳng định:
- BBC vẫn ủng hộ và đang ứng dụng AI trong phụ đề và dịch thuật
- Cần kiểm soát chặt chẽ việc sử dụng nội dung bởi các công ty AI
- Cần xây dựng quan hệ đối tác mạnh mẽ giữa các công ty AI và truyền thông

📌 Nghiên cứu của BBC về 4 trợ lý AI hàng đầu cho thấy 51% câu trả lời có vấn đề nghiêm trọng, trong đó 19% sai sót về dữ liệu và 13% trích dẫn không chính xác. Kết quả đặt ra nhu cầu cấp thiết về kiểm soát chất lượng AI trong lĩnh vực truyền thông.

https://www.bbc.co.uk/mediacentre/2025/bbc-research-shows-issues-with-answers-from-artificial-intelligence-assistants

Dưới đây là tóm tắt từ file tài liệu nghiên cứu của BBC:

Tóm tắt nghiên cứu của BBC về trợ lý AI

📌 Tổng quan

BBC nghiên cứu cách các trợ lý AI như ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) và Perplexity đại diện nội dung tin tức của BBC.
Trong thí nghiệm, các AI này được cấp quyền truy cập BBC News để kiểm tra độ chính xác khi trích dẫn tin tức.
Các câu trả lời được đánh giá bởi các nhà báo của BBC dựa trên 7 tiêu chí, gồm độ chính xác, trích dẫn nguồn, tính trung lập, tách biệt giữa ý kiến và sự thật, biên tập thêm, ngữ cảnh, và cách AI thể hiện nội dung BBC.

📌 Kết quả chính

1. Sai sót và bóp méo nội dung tin tức

51% câu trả lời từ AI có vấn đề nghiêm trọng, trong đó:
- 19% có lỗi thực tế (sai số liệu, ngày tháng).
- 13% các trích dẫn từ BBC bị thay đổi hoặc không có trong bài báo gốc.
- 91% chứa ít nhất một số vấn đề nhỏ.
Các lỗi cụ thể từ từng AI:
- Gemini (Google): 46% câu trả lời có lỗi nghiêm trọng, thường là thông tin sai lệch về chính sách y tế.
- Copilot (Microsoft): Báo cáo không chính xác về vụ án của Gisèle Pelicot.
- Perplexity: Sai ngày mất của Michael Mosley, thay đổi lời phát biểu của gia đình Liam Payne.
- ChatGPT (OpenAI): Đưa tin sai về lãnh đạo Hamas Ismail Haniyeh.

2. Vấn đề trích dẫn nguồn và sử dụng thông tin lỗi thời

34% câu trả lời của Gemini, 27% của Copilot, 17% của Perplexity, 15% của ChatGPT có vấn đề về cách trích dẫn tin tức BBC.
Perplexity luôn trích dẫn ít nhất một nguồn từ BBC, nhưng Gemini chỉ dùng BBC làm nguồn trong 53% trường hợp.
AI thường sử dụng tin cũ hoặc trang tin trực tiếp, dẫn đến lỗi như tuyên bố Nicola Sturgeon vẫn là Thủ tướng Scotland (trong khi đã từ chức).

3. Nhầm lẫn giữa ý kiến cá nhân và sự thật

23 trường hợp AI trình bày ý kiến của chuyên gia hoặc chính trị gia như sự thật:
- Perplexity gán các lời phê bình chính sách COVID-19 của Wales cho báo cáo chính thức của chính phủ.
- Copilot mô tả các biện pháp kiểm soát trợ tử ở Anh là "nghiêm ngặt", nhưng không nhấn mạnh rằng đây chỉ là quan điểm của một nghị sĩ.

4. Thiếu bối cảnh và biên tập quá mức

Gemini và Copilot bị đánh giá cao nhất về việc biên tập thêm nội dung:
- Ví dụ, Gemini mô tả Iran "ban đầu kiềm chế" và Israel "hành động gây hấn", mặc dù BBC không sử dụng những thuật ngữ này.
AI thường kết luận một câu mang tính tổng quát mà không trích dẫn nguồn, như Copilot viết rằng "Kế hoạch của Đảng Lao động rất toàn diện", tạo ấn tượng rằng đây là quan điểm của BBC.

📌 Kết luận & Hành động tiếp theo

BBC xác nhận rằng trợ lý AI hiện tại không đáng tin cậy khi cung cấp tin tức, và có nguy cơ làm sai lệch thông tin.
Đề xuất hợp tác với các công ty AI để giải quyết các vấn đề và tăng cường tính minh bạch.
Kêu gọi chính phủ và các cơ quan quản lý như Ofcom thiết lập quy định đảm bảo AI tôn trọng nội dung của các cơ quan báo chí chính thống.
BBC sẽ tiếp tục nghiên cứu định kỳ, có thể mở rộng để kiểm tra cách AI đại diện nội dung của các cơ quan truyền thông khác.

📌 Ý nghĩa & rủi ro

Thông tin sai lệch có thể gây hậu quả nghiêm trọng, đặc biệt trong các lĩnh vực như y tế, chính trị và an ninh.
AI cần cải thiện khả năng nhận diện nguồn tin chính thống và phân biệt giữa dữ kiện và quan điểm.
Sự hợp tác giữa các công ty AI, cơ quan báo chí và chính phủ là cần thiết để đảm bảo tính chính xác của thông tin trong kỷ nguyên AI.

Không có file đính kèm.

Nguồn tham khảo

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng