GPU AI Moore Threads MTT S4000 của Trung Quốc dùng để huấn luyện mô hình ngôn ngữ lớn 3 tỷ tham số, cạnh tranh được với Nvidia

- Moore Threads tuyên bố GPU AI S4000 mới nhất của họ nhanh hơn đáng kể so với thế hệ trước.
- Cụm Tính toán Thông minh Kua'e Qianka mới sử dụng GPU S4000 xếp thứ 3 về tốc độ trong bài kiểm tra AI, vượt trội hơn một số cụm GPU AI Nvidia.
- Quá trình huấn luyện mô hình ngôn ngữ lớn MT-infini-3B trên cụm Kua'e Qianka mất 13,2 ngày, chạy hoàn hảo không gián đoạn.
- Tuy nhiên, bảng so sánh thiếu chi tiết, không rõ GPU Nvidia nào được dùng (A100, H100 hay H200) và tác vụ huấn luyện có thể khác nhau.
- Dù vậy, việc huấn luyện LLM trên GPU Moore Threads là bước tiến quan trọng trong lộ trình GPU nội địa của Trung Quốc.
- Hiệu năng thô của S4000 vượt trội hơn nhiều so với GPU AI S3000 và S2000 trước đó của Moore Threads, cũng như vượt qua các bộ tăng tốc AI thế hệ Turing của Nvidia.
- Mặc dù chưa sánh được với GPU AI A100 của Nvidia, nhưng S4000 cho thấy Moore Threads đã có thể xây dựng GPU AI cạnh tranh được với đối thủ phương Tây.
- Đây là thành tựu ấn tượng với một nhà sản xuất GPU mới thành lập chưa đầy 5 năm như Moore Threads.
- Nếu Moore Threads tiếp tục cải thiện hiệu năng qua các thế hệ, họ có thể có bộ tăng tốc GPU AI ngang ngửa với đối thủ phương Tây trong vài năm tới.

📌 GPU AI S4000 mới nhất của Moore Threads cho thấy bước tiến vượt bậc của Trung Quốc trong việc bắt kịp hiệu năng AI của phương Tây. Mặc dù chưa vượt qua được A100 của Nvidia, nhưng khả năng huấn luyện LLM 3 tỷ tham số trong 13,2 ngày của cụm Kua'e Qianka sử dụng S4000 là một cột mốc quan trọng, hứa hẹn Moore Threads sẽ sớm cạnh tranh trực tiếp với các đối thủ như Nvidia, AMD, Intel trong tương lai gần.

https://www.tomshardware.com/pc-components/gpus/china-made-moore-threads-ai-gpus-used-for-three-billion-parameter-llm-training-mtt-s4000-appears-competitive-against-unspecified-nvidia-solutions

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo