Đánh giá Qwen3 – mô hình AI tạo sinh nguồn mở mới nhất của Alibaba Cloud, hỗ trợ 119 ngôn ngữ

  • Qwen3 là thế hệ mới nhất của mô hình ngôn ngữ lớn (LLM) nguồn mở từ Alibaba Cloud, phát hành ngày 29.04.2025, cấp phép Apache 2.0, phù hợp dùng thương mại.

  • Có 8 phiên bản: từ 0.6B đến 32B tham số dạng dense và hai dạng MoE là Qwen3-235B (235 tỷ/22 tỷ tham số hoạt động cùng lúc), Qwen3-30B (30 tỷ/3 tỷ tham số hoạt động). Dung lượng bối cảnh tối đa tới 128.000 tokens.

  • Kiến trúc Mixture-of-Experts (MoE) giúp mô hình lớn nhưng tiết kiệm tài nguyên – ví dụ Qwen3-235B chỉ dùng 22B tham số khi xử lý, giảm chi phí GPU.

  • Được huấn luyện trên 36 nghìn tỷ tokens, phủ 119 ngôn ngữ, bao gồm dữ liệu web, sách, PDF, code và toán tổng hợp.

  • Qwen3-235B dẫn đầu benchmark CodeForces Elo Rating, BFCL, LiveCodeBench v5; chỉ thua Gemini 2.5 Pro ở ArenaHard, AIME, MultilF, Aider Pass@2.

  • Qwen3-30B vượt trội về tốc độ và độ chính xác với các mô hình nguồn mở khác, chỉ bị QwQ-32B hay GPT-4o vượt qua ở một số chỉ số chuyên biệt.

  • Có hai chế độ “thinking” (suy nghĩ sâu đa bước) và “non-thinking” (phản hồi nhanh, gọn), tự động chuyển theo ngữ cảnh/tác vụ người dùng.

  • Được tối ưu cho lập trình, giải toán, tư duy logic, tạo tác nhân AI, sử dụng công cụ, duyệt web; Qwen3-4B thậm chí vượt cả mô hình 72B cũ ở một số nhiệm vụ lập trình.

  • Có thể tải xuống từ Hugging Face, GitHub, Ollama cùng hướng dẫn chi tiết về tokenizer, tinh chỉnh, triển khai.

📌 Qwen3 của Alibaba Cloud là AI tạo sinh nguồn mở đa ngôn ngữ, có đến 235 tỷ tham số với kiến trúc MoE tiết kiệm GPU, dẫn đầu nhiều chỉ số benchmark về lập trình, logic và tác nhân AI. Mô hình dễ tích hợp, phù hợp ứng dụng thương mại, hỗ trợ tới 119 ngôn ngữ.

https://bestcodes.dev/blog/qwen-3-what-you-need-to-know

Không có file đính kèm.

11

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo