Startup AI Nhật Bản Sakana AI ra mắt The AI CUDA Engineer - framework tự động phát hiện và tối ưu hóa CUDA kernel nhằm cải thiện hiệu suất GPU
Framework này có khả năng tạo CUDA kernel nhanh hơn từ 10 đến 100 lần so với các thao tác PyTorch thông thường và nhanh hơn 5 lần so với CUDA kernel đang được sử dụng trong sản xuất
CUDA là giao diện lập trình cấp thấp cho phép truy cập trực tiếp vào GPU NVIDIA để tính toán song song
Jim Fan, giám đốc nghiên cứu cấp cao tại NVIDIA đánh giá đây là agent lập trình tự động ấn tượng nhất gần đây
Framework hoạt động theo quy trình nhiều giai đoạn:
Chuyển đổi mã PyTorch thành CUDA kernel
Áp dụng tối ưu hóa tiến hóa
Sử dụng chiến lược "crossover" và "innovation archive" để cải thiện hiệu suất
Kết quả đạt được:
Đã chuyển đổi thành công hơn 230/250 thao tác PyTorch được đánh giá
Tạo ra hơn 30.000 CUDA kernel
17.000 kernel đã được xác minh tính chính xác
50% kernel có hiệu suất vượt trội so với PyTorch nguyên bản
Sakana AI đã công bố:
Bộ dữ liệu theo giấy phép CC-By-4.0 trên Hugging Face
Website tương tác cho phép người dùng khám phá dữ liệu và bảng xếp hạng kernel đã tối ưu
Cung cấp mã nguồn kernel, số liệu hiệu suất và các thử nghiệm tối ưu hóa liên quan
📌 Framework AI CUDA Engineer của Sakana đã chứng minh khả năng tăng tốc GPU lên đến 100 lần, với 17.000 kernel được xác thực và 50% vượt trội so với PyTorch. Đây là bước tiến quan trọng trong việc tự động hóa tối ưu hóa CUDA kernel thông qua AI.
https://analyticsindiamag.com/ai-news-updates/sakanas-ai-cuda-engineer-delivers-up-to-100x-speed-gains-over-pytorch/