Amazon chi 1 tỷ USD cho AI, tung Project Greenland vượt khủng hoảng thiếu GPU

  • Năm ngoái, Amazon đối mặt tình trạng thiếu hụt nghiêm trọng AI chip/GPU trong mảng bán lẻ, gây trì hoãn nhiều dự án lớn và ảnh hưởng đến vận hành của nền tảng thương mại điện tử cùng logistics.

  • Đầu năm 2024, nhu cầu GPU tăng mạnh toàn cầu do AI tạo sinh bùng nổ, khiến nhân viên Amazon phải chờ nhiều tháng mới được cấp GPU, làm chậm các dự án quan trọng.

  • Tháng 7/2024, Amazon triển khai Project Greenland – hệ thống “hồ” GPU tập trung, giúp kiểm soát, phân bổ và theo dõi GPU hiệu quả. Công ty siết chặt quy trình phê duyệt GPU, dựa trên dữ liệu ROI và timeline cụ thể thay vì ưu tiên đến trước được cấp trước.

  • Mọi yêu cầu GPU nội bộ đều phải có dữ liệu chứng minh lợi nhuận và mức độ sẵn sàng triển khai (“shovel-ready”), đồng thời phải cạnh tranh về tốc độ ra thị trường.

  • Dự án Greenland sử dụng nền tảng điều phối GPU tập trung, cho phép chia sẻ máy chủ, truy xuất GPU nhàn rỗi, đồng thời có tính năng “clawback” - thu hồi GPU từ các dự án đạt hiệu quả thấp để phân bổ lại.

  • Từ đầu 2025, toàn bộ nhân viên phải thông qua Greenland khi xin GPU mới, giúp giảm lãng phí, tối ưu hóa tài nguyên đám mây AWS.

  • 8 nguyên tắc (tenets) phân bổ GPU được Amazon đặt ra gồm: ưu tiên ROI thực tế, học hỏi liên tục, tránh quyết định theo silo, coi trọng thời gian, tăng hiệu suất, dám chấp nhận rủi ro đổi mới, minh bạch nhưng bảo mật, có thể thu hồi GPU nếu dự án kém hiệu quả.

  • Mảng bán lẻ đầu tư tổng hơn 1 tỷ USD cho các dự án AI sử dụng GPU năm 2025, trong đó dự kiến chi khoảng 5,7 tỷ USD cho hạ tầng AWS (tăng từ 4,5 tỷ USD năm 2024).

  • Trong năm qua, AI đã giúp Amazon Retail tăng thêm 2,5 tỷ USD lợi nhuận vận hành và tiết kiệm khoảng 670 triệu USD chi phí biến đổi.

  • Các dự án AI nổi bật: trợ lý mua sắm Rufus, trình tạo ảnh sản phẩm Theia, hệ thống nhận diện gói hàng cho tài xế, tối ưu lộ trình giao hàng, tự động truy xuất thông tin sản phẩm, điều tra gian lận người bán...

  • Quý cuối 2024, Amazon thiếu trên 1.000 instance P5 (chứa tới 8 Nvidia H100 GPU), tuy nhiên dự báo thặng dư GPU vào cuối 2025 nhờ cải thiện nguồn cung và dùng chip AI Trainium “cây nhà lá vườn” của AWS.

  • Dù vậy, tốc độ tăng trưởng nhu cầu AI và GPU vẫn là thách thức lớn, Greenland phải liên tục thích nghi với xu thế, tiếp tục tuyển nhân sự để mở rộng nguồn lực.

📌 Amazon đã chuyển bại thành thắng trong khủng hoảng thiếu GPU, đầu tư trên 1 tỷ USD cho AI năm 2025, tiết kiệm gần 670 triệu USD chi phí và tăng 2,5 tỷ USD lợi nhuận vận hành nhờ các quy trình phân bổ GPU sáng tạo và Project Greenland.

 

https://www.businessinsider.com/amazon-strategy-overcome-gpu-shortages-nvidia-2025-4

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo