- Deepseek, phòng thí nghiệm AI từ Trung quốc vừa phát hành mô hình AI nguồn mở Deepseek v3, vượt trội so với nhiều đối thủ trong các bài kiểm tra phổ biến
- Mô hình này thể hiện hiện tượng kỳ lạ khi tự nhận mình là Chatgpt và khẳng định là phiên bản của GPT-4 được phát hành năm 2023
- Trong 8 lần thử nghiệm, Deepseek v3 tự nhận là Chatgpt (v4) 5 lần và chỉ nhận đúng là Deepseek v3 3 lần
- Khi được hỏi về API của Deepseek, mô hình này lại đưa ra hướng dẫn sử dụng API của OpenAI
- Mike Cook, nghiên cứu viên tại King's College London, cho rằng hiện tượng này có thể do mô hình được huấn luyện trên dữ liệu có chứa phản hồi từ Chatgpt
- Điều khoản dịch vụ của OpenAI cấm người dùng sử dụng đầu ra để phát triển các mô hình cạnh tranh
- Sam Altman, CEO OpenAI, đã đăng bài chỉ trích: "Sao chép điều gì đó đã hoạt động thì tương đối dễ. Làm điều mới mẻ, rủi ro và khó khăn khi không biết liệu nó có hoạt động hay không mới thực sự khó"
- Theo ước tính, 90% nội dung web có thể được tạo bởi AI vào năm 2026
- Heidy Khlaaf, nhà khoa học trưởng về AI tại AI Now Institute, cho rằng việc "chưng cất" kiến thức từ mô hình hiện có có thể giúp tiết kiệm chi phí cho các nhà phát triển
📌 Deepseek v3 từ Trung quốc cho thấy vấn đề nghiêm trọng về dữ liệu huấn luyện AI khi tự nhận mình là Chatgpt trong 5/8 lần thử nghiệm. Hiện tượng này cảnh báo về nguy cơ 90% nội dung web sẽ do AI tạo ra vào 2026, ảnh hưởng đến chất lượng dữ liệu huấn luyện trong tương lai.
https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/