Qwen 3 là dòng mô hình AI mới từ Alibaba, bao gồm Qwen3-235B-A22B (MoE, chỉ 22B tham số hoạt động) và Qwen3-30B-A3B nhẹ hơn (3B tham số hoạt động).
Qwen3-235B-A22B vượt qua nhiều benchmark hàng đầu như HumanEval, GSM8K, BoolQ, ARC-Challenge, MATH, Big-Bench Hard.
Cả hai phiên bản của Qwen3 đều sử dụng thiết kế Mixture of Experts, giúp tiết kiệm chi phí suy luận lên đến 90% so với mô hình thông thường.
Trong bài toán tạo ứng dụng ghi chú, Qwen3 cho kết quả nhanh, thân thiện với người dùng, còn DeepSeek R1 tốn thời gian hơn.
Với trò chơi Conway's Game of Life, Qwen3 cung cấp code đơn giản và mẫu thử dễ dùng, trong khi DeepSeek R1 yêu cầu tệp test và phức tạp hơn.
Trong bài toán tạo hình SVG con bướm, Qwen3 tạo ra hình ảnh chính xác và cân xứng hơn so với kết quả hoạt hình của DeepSeek R1.
Ở bài toán suy luận “ai là người phạm tội?”, cả hai mô hình đều ra đáp án đúng là David, nhưng DeepSeek nhanh hơn 40 giây.
Trong bài toán lập kế hoạch đi tham quan, cả hai mô hình cho ra kết quả giống nhau nhưng Qwen3 trình bày logic rõ ràng hơn.
Với bài toán toán học về hai đoàn tàu gặp nhau, Qwen3 xử lý logic rõ ràng, tính đúng thời điểm 1:12 PM, trong khi DeepSeek chuyển đổi phương pháp khiến mất thời gian.
Trong câu hỏi tính toán nhiên liệu trong trò chơi đua xe, DeepSeek R1 cho kết quả chính xác 27,3L và khuyến nghị thêm, còn Qwen3 chỉ ra 26,4L và gợi ý dự phòng.
Trong phần viết, Qwen3 chia rõ 3 phần nội dung, tóm tắt rõ ràng, trong khi DeepSeek R1 viết dồn thành khối khó đọc.
Về tổng thể, Qwen3 vượt trội ở khả năng lập trình, viết lách và xử lý bài toán chuẩn xác; DeepSeek R1 có lợi thế ở tốc độ phản hồi và bài toán logic phức tạp.
Cả hai đều là lựa chọn AI mã nguồn mở mạnh mẽ, nhưng Qwen3 nổi bật nhờ khả năng toàn diện, chi phí thấp và hỗ trợ triển khai cục bộ.
📌 Qwen 3 nổi bật nhờ thiết kế MoE hiệu quả (chỉ 10% tham số hoạt động), vượt mặt DeepSeek R1 trong lập trình, viết và bài toán thực tế. DeepSeek R1 vẫn có lợi thế về tốc độ và giải toán phức tạp. Với benchmark cao, chi phí thấp và mã nguồn mở (Apache 2.0), Qwen 3 là lựa chọn lý tưởng thay thế GPT-4 Omni.
https://dev.to/composiodev/qwen-3-vs-deep-seek-r1-evaluation-notes-1bi1