Deepseek không chính xác 83% thời gian: Sự thật hay chỉ là tuyên truyền chống Trung Quốc?

  • Theo báo cáo mới từ News Guard, Deepseek - chatbot AI từ Trung Quốc - không chính xác tới 83% thời gian khi trả lời các câu hỏi liên quan đến tin tức.

  • Kết quả nghiên cứu cho thấy 30% phản hồi của Deepseek chứa thông tin sai lệch, không xác thực hoặc thậm chí củng cố các tuyên bố sai sự thật thay vì bác bỏ chúng.

  • 53% trường hợp, Deepseek hoàn toàn không đưa ra câu trả lời hoặc cung cấp thông tin mơ hồ, không đầy đủ, khiến người dùng bối rối hơn.

  • Chỉ 17% phản hồi của Deepseek đúng sự thật hoặc thành công trong việc bác bỏ thông tin sai lệch, thấp hơn đáng kể so với các đối thủ phương Tây như Chatgpt và Google Bard.

  • News Guard đã thử nghiệm Deepseek với 57 câu hỏi được thiết kế để đánh giá khả năng xử lý thông tin sai lệch, bao gồm các tin đồn sai sự thật đã biết, các chủ đề chính trị phức tạp và các câu hỏi yêu cầu phản hồi chính xác.

  • Một trong những nguyên nhân chính khiến Deepseek kém chính xác là dữ liệu huấn luyện chỉ cập nhật đến tháng 10/2023, khiến nó không thể trả lời chính xác về các sự kiện sau thời điểm này.

  • Deepseek cũng thiếu cơ chế kiểm tra thông tin thời gian thực, không giống như Chatgpt và Google Bard có khả năng đối chiếu thông tin từ nhiều nguồn.

  • Một số nhà phân tích nhận thấy Deepseek thường phản ánh quan điểm chính thức của chính phủ Trung Quốc khi thảo luận về các chủ đề nhạy cảm như Đài Loan, Tây Tạng hoặc Hồng Kông.

  • Trong bảng so sánh các mô hình AI lớn, Deepseek nổi bật với tỷ lệ thất bại 83%, cao hơn nhiều so với mức trung bình 62% của các chatbot trong đánh giá của News Guard.

  • Các nhà phê bình báo cáo cho rằng Deepseek đã bị kiểm tra không công bằng với các câu hỏi được thiết kế để đánh bẫy, tuy nhiên News Guard khẳng định phương pháp của họ là tiêu chuẩn trong mọi đánh giá AI.

📌 Deepseek thất bại với tỷ lệ 83% khi trả lời các câu hỏi về tin tức, chỉ 17% câu trả lời chính xác, cho thấy hạn chế nghiêm trọng về dữ liệu cũ (chỉ đến 10/2023), thiếu cơ chế kiểm tra thông tin và khả năng phản ánh quan điểm của chính phủ Trung Quốc trong các vấn đề nhạy cảm.

 

https://corexbox.com/deepseek-responses-inaccurate-83-of-the-time-experts-find-is-it-truth/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo