• NPU (Neural Processing Unit) là đơn vị xử lý thần kinh, một loại bộ xử lý chuyên dụng để tăng tốc các tác vụ AI.
• NPU đã xuất hiện trên smartphone từ vài năm trước, gần đây bắt đầu phổ biến trên laptop và PC tiêu dùng.
• Các hãng lớn như Intel, AMD, Apple, Qualcomm đều đang tích hợp NPU vào chip của mình.
• NPU đóng vai trò là bộ tăng tốc phần cứng cho AI, bổ sung cho CPU và GPU chứ không thay thế chúng.
• NPU phù hợp với các tác vụ lặp đi lặp lại, ít rẽ nhánh có điều kiện và xử lý lượng lớn dữ liệu.
• Kiến trúc NPU gồm nhiều đơn vị con song song, mỗi đơn vị có bộ nhớ cache riêng nhỏ.
• NPU được thiết kế để mô phỏng cách xử lý thông tin của não bộ.
• Các hãng đều phát triển công cụ phần mềm riêng cho NPU của mình như AMD Ryzen AI, Intel OpenVINO.
• NPU đóng vai trò quan trọng trong xu hướng AI biên (edge AI), xử lý dữ liệu cục bộ nhanh hơn và bảo mật hơn.
• NPU hiện có mặt trong nhiều thiết bị tiêu dùng như smartphone, tablet, laptop, PC và cả trong trung tâm dữ liệu.
• Dự kiến đến cuối năm 2026, 100% PC doanh nghiệp tại Mỹ sẽ có NPU tích hợp sẵn.
• Microsoft đã ra mắt dòng sản phẩm Copilot+ AI PC có tích hợp NPU để chạy trợ lý AI Copilot.
• NPU xử lý các tác vụ AI suy luận (inference) ở quy mô nhỏ, khác với GPU xử lý huấn luyện AI quy mô lớn.
• Qualcomm tích hợp NPU vào chip Snapdragon dưới dạng DSP Hexagon.
• Apple gọi NPU trong chip A-series và M-series là Neural Engine.
• Google phát triển TPU (Tensor Processing Unit) - một dạng NPU cho trung tâm dữ liệu.
📌 NPU đang trở thành công nghệ phổ biến trong các thiết bị điện tử, với 100% PC doanh nghiệp Mỹ dự kiến tích hợp NPU vào năm 2026. NPU mang lại khả năng xử lý AI cục bộ nhanh và bảo mật hơn, mở ra tiềm năng ứng dụng AI rộng rãi trên các thiết bị cá nhân.
https://www.extremetech.com/computing/what-is-an-npu