• Các trung tâm dữ liệu đang tích hợp các chip chuyên dụng và "đồng xử lý" để tăng cường khả năng xử lý các tác vụ AI phức tạp.
• GPU chiếm 74% thị phần đồng xử lý cho các ứng dụng AI trong trung tâm dữ liệu năm ngoái, dự kiến đạt doanh thu 102 tỷ USD vào năm 2028.
• Tuy nhiên, chi phí sở hữu GPU rất cao. Ví dụ: một máy chủ với 36 chip GB200 của Nvidia có thể lên tới 2 triệu USD.
• Nhiều doanh nghiệp đang tìm kiếm các giải pháp thay thế hiệu quả về chi phí cho các tác vụ AI cường độ thấp và trung bình.
• Các bộ xử lý và bộ tăng tốc AI chuyên dụng đang nổi lên như một giải pháp thay thế, tập trung vào các chức năng AI cụ thể.
• 3 kiến trúc chính bao gồm: Mạch tích hợp chuyên dụng (ASIC), Mảng cổng có thể lập trình (FPGA) và Đơn vị xử lý thần kinh (NPU).
• ASIC được xây dựng tùy chỉnh cho một tác vụ cụ thể, FPGA có thể được cấu hình lại, còn NPU chỉ tập trung vào việc tăng tốc các tác vụ AI/ML.
• Các bộ tăng tốc, đặc biệt là ASIC và NPU, có thể hiệu quả hơn GPU về chi phí và mức tiêu thụ điện năng.
• IBM đang sử dụng cả GPU và bộ tăng tốc AI từ nhiều nhà cung cấp như Nvidia và Intel trong hệ thống đám mây lai của mình.
• Các máy chủ ảo IBM Cloud sử dụng bộ tăng tốc Gaudi 3 của Intel cho các tác vụ suy luận và yêu cầu bộ nhớ cao.
• Nhiều startup như Groq, Graphcore, SambaNova Systems và Cerebras Systems cũng đang phát triển các sản phẩm bộ tăng tốc AI chuyên dụng.
• Tractable, một công ty phát triển AI để phân tích thiệt hại tài sản, đã đạt được hiệu suất tăng gấp 5 lần khi sử dụng hệ thống IPU-POD của Graphcore so với GPU.
• Các bộ xử lý AI cũng đang được sử dụng cho các tác vụ huấn luyện AI trong một số trường hợp.
• Việc lựa chọn bộ tăng tốc AI phù hợp phụ thuộc vào quy mô và loại tác vụ, dữ liệu, khả năng lặp lại/thay đổi liên tục và nhu cầu về chi phí và tính sẵn có.
• Các chuyên gia khuyến nghị nên chạy các bài kiểm chuẩn để đánh giá lợi ích về hiệu suất và chi phí trước khi đưa ra quyết định.
• Thị trường phần cứng AI tổng thể, bao gồm chip AI, bộ tăng tốc và GPU, dự kiến sẽ tăng trưởng 30% hàng năm, đạt 138 tỷ USD vào năm 2028.
📌 Thị trường chip AI đang phát triển đa dạng với sự xuất hiện của các bộ xử lý và tăng tốc chuyên dụng như ASIC, FPGA và NPU. Các giải pháp này hứa hẹn mang lại hiệu quả chi phí và năng lượng cao hơn so với GPU truyền thống cho nhiều tác vụ AI cụ thể. Dự kiến thị trường phần cứng AI sẽ đạt 138 tỷ USD vào năm 2028, tăng trưởng 30% hàng năm.
https://venturebeat.com/data-infrastructure/going-beyond-gpus-the-evolving-landscape-of-ai-chips-and-accelerators/