CUDA core là đơn vị xử lý SIMD (Single Instruction, Multiple Data) bên trong card đồ họa Nvidia, hỗ trợ xử lý song song cho các tác vụ đồ họa, AI và tính toán dữ liệu lớn.
CUDA là nền tảng lập trình song song do Nvidia phát triển gần 20 năm trước, lần đầu ra mắt năm 2006 trên GeForce 8800 GTX với 128 CUDA core.
CUDA hỗ trợ nhiều ngôn ngữ như C, C++, Fortran, Python, Julia và tích hợp nhiều API lẫn framework, như Direct3D, OpenGL, OpenMP, OpenCL, OpenACC.
Số lượng CUDA core tăng nhanh qua từng thế hệ: RTX 4090 có 16.384 nhân, RTX 5090 đạt 21.760 nhân, đáp ứng cả gaming độ phân giải cao và các tác vụ chuyên sâu như học máy, render 3D, video encoding, mô phỏng khoa học.
CUDA core sử dụng mô hình SIMT (Single Instruction, Multiple Threads) cho phép hàng ngàn nhân cùng lúc xử lý các tác vụ giống nhau, tối ưu cho các công việc cần song song hóa mạnh.
CPU thường chỉ có 16-32 nhân (như Ryzen 9 9950X3D), trong khi GPU phổ thông đã có khoảng 3.000 CUDA core, giúp tăng tốc quá trình xử lý video, gaming, mô phỏng khoa học.
Khác biệt cơ bản: CPU core tối ưu cho xử lý tuần tự, độ trễ thấp; CUDA core tối ưu cho thông lượng, chia nhỏ công việc để song song hóa tối đa.
CUDA platform cung cấp thư viện phong phú, cộng đồng lập trình lớn, mở rộng ứng dụng AI, đồ họa, xử lý ảnh, khoa học tính toán.
Card đồ họa AMD không dùng CUDA core mà dùng Stream Processor với nguyên lý tương tự, song không thể so sánh trực tiếp số lượng nhân giữa hai hãng.
Từ 2007, CUDA Toolkit liên tục nâng cấp (hiện ở bản 12), ưu tiên cho GPU Nvidia dòng H100, A100 phục vụ trung tâm dữ liệu, siêu máy tính.
📌 Hiện nay, GPU Nvidia trang bị từ vài nghìn tới hơn 20.000 CUDA core, là chìa khóa thúc đẩy hiệu năng gaming, AI, xử lý video, khoa học dữ liệu và giúp Nvidia duy trì vị thế dẫn đầu công nghệ GPU. CUDA core và nền tảng CUDA đã góp phần cách mạng hóa khả năng tính toán song song của máy tính hiện đại.
https://www.techradar.com/computing/gpu/what-is-a-cuda-core