Báo cáo nhấn mạnh cách AI, đặc biệt là inference phân tán (distributed inference), đang nâng cao giá trị của điện toán biên trong ngành viễn thông, mang lại lợi ích về tốc độ xử lý, bảo mật dữ liệu, hiệu quả năng lượng, khả năng phục hồi và cả lợi ích tài chính.
Dự kiến từ năm 2024 đến 2030, cloud và edge sẽ tạo thêm 700 EB lưu lượng dữ liệu di động doanh nghiệp. Việc đưa xử lý dữ liệu gần người dùng hơn (on-premise hoặc thiết bị edge) buộc các nhà mạng phải thích nghi, với trọng tâm là "mạng thông minh".
AI inference sẽ giúp tối ưu hiệu suất mạng, nâng cao trải nghiệm khách hàng và hỗ trợ các ứng dụng doanh nghiệp. Các ứng dụng edge được ưu tiên gồm: robot công nghiệp, camera an ninh, bản sao số (digital twins), IoT và phương tiện tự hành.
Các lĩnh vực doanh nghiệp như sân vận động, điểm bán hàng không thu ngân, AR/VR cũng nằm trong danh sách triển khai tiềm năng nhưng cần thời gian trưởng thành về công nghệ và hệ sinh thái.
Mỗi nhà mạng sẽ có chiến lược triển khai AI riêng tùy thuộc vào hoàn cảnh thị trường, nhưng 50% xem doanh thu từ AI là ưu tiên hàng đầu. AI được sử dụng như công cụ để khắc phục sự trì trệ trong việc kiếm tiền từ 5G.
Một xu hướng nổi bật là "GPU-as-a-Service" – nhà mạng kết hợp GPU (từ NVIDIA, v.v.) vào hạ tầng và bán lại năng lực xử lý AI như dịch vụ (ví dụ: SKT, Swisscom, T-Mobile).
Khái niệm "edge" trong báo cáo được định nghĩa như một phổ liên tục từ trung tâm dữ liệu tập trung đến thiết bị người dùng cuối, với năng lực inference trải dài qua tất cả các điểm này.
Giai đoạn inference – khác với training – diễn ra trong thời gian thực và là mấu chốt để AI hoạt động trong thực tế, từ chăm sóc khách hàng bằng AI đến bảo trì phòng ngừa mạng.
Ưu điểm lớn nhất của inference phân tán là xử lý tại chỗ giúp tiết kiệm năng lượng (giảm 50–60% điện năng tiêu thụ), tăng bảo mật dữ liệu (dữ liệu không rời quốc gia) và hỗ trợ các mô hình ngôn ngữ lớn địa phương.
Đến năm 2030, thiết bị IoT dự kiến đạt 38 tỷ, phần lớn đến từ khách hàng doanh nghiệp (2/3 tăng trưởng). Ngành công nghiệp như ô tô, thành phố thông minh và y tế được dự đoán là động lực chính cho nhu cầu edge trong 5 năm tới.
AI inference đang được triển khai mạnh trong các use case như robot công nghiệp, AR/VR, phương tiện tự hành và bản sao số – những ứng dụng vừa tạo doanh thu vừa tiết kiệm chi phí.
Các nhà mạng cần chuẩn bị về tốc độ, độ trễ và tải tính toán để đáp ứng inference phân tán, đồng thời khai thác dữ liệu khách hàng, kết hợp AI với phân tích lớn (big data), dịch vụ tài chính, và bảo mật như một phần trong hệ sinh thái dịch vụ AI mới.
📌 AI đang thúc đẩy mạnh mẽ điện toán biên, đặc biệt là trong ngành viễn thông. Từ 2024–2030, cloud và edge dự kiến hấp thụ 700 EB lưu lượng dữ liệu doanh nghiệp mới. Với dự báo 38 tỷ thiết bị IoT vào năm 2030 và tiềm năng tiết kiệm đến 60% năng lượng khi xử lý tại edge, AI inference không chỉ mở rộng dịch vụ mà còn trở thành động lực doanh thu quan trọng của nhà mạng.
https://www.gsmaintelligence.com/research/distributed-inference-how-ai-can-turbocharge-the-edge
#GSMA
Robot công nghiệp:
Là một trong những use case chủ đạo tại "enterprise edge" (đặt trong các nhà máy, kho bãi hoặc địa điểm công nghiệp). AI inference tại chỗ cho phép robot phản ứng thời gian thực, giảm độ trễ và không phụ thuộc vào kết nối mạng liên tục với cloud. Việc xử lý trực tiếp tại thiết bị giúp cải thiện năng suất, độ chính xác và an toàn trong vận hành.
Bản sao số (Digital twins):
Là bản sao ảo của hệ thống vật lý trong thời gian thực. AI inference xử lý dữ liệu cảm biến đầu vào liên tục để dự đoán lỗi, tối ưu bảo trì và mô phỏng kịch bản. Đây là công nghệ cốt lõi trong các ngành như sản xuất, năng lượng và hàng không. Do yêu cầu độ chính xác và độ trễ thấp, inference phân tán là giải pháp phù hợp nhất.
Camera an ninh & phân tích hình ảnh:
AI inference giúp xử lý hình ảnh video trực tiếp tại điểm ghi hình (ví dụ: nhà máy, sân bay, trung tâm thương mại). Các tác vụ như nhận diện khuôn mặt, phát hiện hành vi bất thường, hoặc đếm số lượng người được xử lý ngay tại edge, giúp giảm băng thông truyền lên cloud, đồng thời tăng bảo mật và tốc độ phản ứng.
Chăm sóc khách hàng bằng AI:
Các hệ thống chatbot, tổng đài thông minh và trợ lý ảo sử dụng inference tại edge để tăng tốc độ phản hồi và cá nhân hóa trải nghiệm. Các nhà mạng đã triển khai AI này để giảm áp lực lên trung tâm dịch vụ khách hàng và tăng sự hài lòng.
Bảo trì dự phòng (Predictive maintenance):
AI inference theo dõi các chỉ số hệ thống mạng (như RAN hoặc thiết bị phần cứng viễn thông) để phát hiện dấu hiệu lỗi sớm, nhờ đó giảm thời gian chết và chi phí sửa chữa. Các mô hình inference được huấn luyện tập trung nhưng được triển khai phân tán tại các nút mạng để giám sát cục bộ.
Phương tiện tự hành (Autonomous vehicles):
Xe tự lái đòi hỏi inference cục bộ để xử lý thông tin từ radar, camera và cảm biến trong thời gian thực. Dù vẫn là "slow burn" do yêu cầu cao về hệ sinh thái, nhưng nó là một use case trọng điểm đang được thử nghiệm và triển khai dần trong các khu vực kiểm soát (bãi đỗ, sân bay, khu đô thị thông minh).
AR/VR và tìm kiếm bằng camera (Camera-based tutorials):
Ứng dụng trong hướng dẫn tại sân vận động, siêu thị, viện bảo tàng hoặc lớp học. AI inference phân tích hình ảnh từ camera để cung cấp phản hồi hoặc nội dung video theo ngữ cảnh ngay tại thiết bị, không cần gửi lên cloud. Việc giảm độ trễ giúp trải nghiệm trở nên mượt mà và tương tác hơn.
Tạo doanh thu:
Các ứng dụng như robot, camera thông minh, dịch vụ AR/VR và mô hình số thường được doanh nghiệp triển khai để tối ưu vận hành và mở rộng dịch vụ, từ đó tạo ra doanh thu mới.
Tiết kiệm chi phí và phòng ngừa rủi ro:
Chăm sóc khách hàng bằng AI, bảo trì dự đoán và khắc phục sự cố mạng giúp nhà mạng tiết kiệm chi phí vận hành và nâng cao độ tin cậy mạng. Mặc dù không tạo doanh thu trực tiếp, nhưng các use case này mang lại hiệu quả tài chính bền vững.
Nhà mạng xem AI inference là đòn bẩy để nâng cấp dịch vụ doanh nghiệp – một phần quan trọng trong chiến lược khai thác doanh thu từ 5G.
GPU từ NVIDIA hoặc các hãng bán dẫn khác được tích hợp vào hạ tầng để hỗ trợ inference.
Dịch vụ "GPU-as-a-Service" (bán năng lực xử lý AI như dịch vụ) đang được một số nhà mạng như SKT, T-Mobile, Swisscom triển khai thành công.