- TOPS (Tera Operations per Second) là thuật ngữ dùng để đo lường, đơn giản hóa và quảng cáo hiệu năng của Neural Processing Unit (NPU) trong các máy tính AI.
- TOPS cho biết hệ thống có thể thực hiện bao nhiêu nghìn tỷ phép tính mỗi giây. Nó có thể được sử dụng để đo lường hiệu suất tổng thể của hệ thống hoặc của phần cứng cụ thể.
- Ví dụ, card đồ họa NVIDIA RTX 4090 có thể cung cấp hơn 1.300 TOPS, cho dù để chơi game hay tăng tốc các tác vụ AI.
- TOPS không phải là một thước đo hoàn hảo và nhiều yếu tố góp phần vào khả năng xử lý tác vụ AI của hệ thống. Tuy nhiên, nó cung cấp một tham chiếu nhanh về tốc độ của NPU và cách nó so sánh với đối thủ cạnh tranh.
- Microsoft đã đặt ra yêu cầu 40 TOPS để chạy Copilot cục bộ trên hệ thống mà không cần kết nối đến máy chủ của Microsoft.
- Việc kiểm tra NPU cũng cần được hoàn thiện khi chúng ta tiến về phía trước. Đã có các bài kiểm tra hiệu năng nhắm vào riêng NPU và chúng là một khởi đầu tốt trên con đường đo lường sức mạnh theo các tác vụ cụ thể.
📌 TOPS là thước đo quan trọng để đánh giá sức mạnh xử lý AI của NPU trong máy tính, với các hệ thống mạnh như RTX 4090 đạt hơn 1.300 TOPS. Microsoft đặt chuẩn 40 TOPS cho việc chạy Copilot cục bộ. Tuy chưa hoàn hảo, TOPS vẫn là tham chiếu hữu ích về tốc độ NPU.
Citations:
[1] https://www.windowscentral.com/hardware/laptops/what-is-tops