GTC 2025 chứng kiến lượng người tham gia trực tiếp đạt 25.000 người (tăng từ 16.000), 800 công ty toàn cầu góp mặt, hơn 400 đơn vị triển lãm.
Jensen Huang công bố chuyển dịch lớn: từ điện toán tuần tự sang điện toán tăng tốc, tập trung vào hiệu suất tạo token – nền tảng của AI tạo sinh và Agentic AI.
Chip Blackwell Ultra mới tăng hiệu suất 50%, lộ trình tiếp theo là Vera Rubin và Rubin Ultra (2026–2027), Rubin Ultra dự kiến tăng hiệu suất gấp 14 lần.
Khái niệm token generation efficiency thay thế các chỉ số truyền thống như TOPS/FLOPS, đo hiệu quả AI bằng số lượng và chất lượng token/s + chi phí/tốc độ/tốc độ tiêu thụ năng lượng.
NVIDIA ra mắt Dynamo – framework nguồn mở tối ưu suy luận phân tán (inference), giúp mô hình như Llama 70B tăng hiệu suất gấp đôi nhờ phân tách prefill và decode.
Dynamo dùng KV cache phân cấp thông minh, hỗ trợ lưu trữ vào RAM hoặc NVMe thay vì HBM đắt đỏ, tăng throughput và giảm latency.
Trong ứng dụng, Dynamo giúp giảm chi phí suy luận, tăng khả năng phục vụ người dùng đồng thời, hỗ trợ chatbot phức tạp, mã nguồn lớn và bối cảnh sâu rộng.
NVIDIA mở rộng dòng sản phẩm DGX, gồm DGX SuperPOD dùng Blackwell Ultra cho doanh nghiệp, và DGX Spark hợp tác MediaTek dành cho AI ở edge.
Khởi động Instant AI Factory với Equinix – dịch vụ AI quản lý hoàn chỉnh, giúp doanh nghiệp triển khai AI mà không cần hạ tầng riêng.
Tại Quantum Day, định hướng AI-quantum hybrid được xác lập. AWS, Microsoft đồng thuận: tích hợp là cách khả thi duy nhất. Ví dụ: IonQ cải thiện 12% mô phỏng bơm máu.
NVIDIA chuyển hướng lại chiến lược AI Enterprise SaaS: thay vì kiếm tiền từ phần mềm, dùng để tạo nhu cầu phần cứng AI, hợp tác với Accenture, HPE, Amdocs, ServiceNow.
Ra mắt khái niệm Neotelco: telco triển khai GPU-as-a-Service (GPUaaS), hướng tới thị trường AI có tính chủ quyền cao. Hợp tác với 12 telco và nhóm phát triển AI-native 6G.
NVIDIA và AI-RAN Alliance thúc đẩy RAN dùng GPU thay vì ASIC, 85 thành viên hiện tại, hướng tới 6G AI-native với sự hỗ trợ từ T-Mobile, Cisco, MITRE.
Triển khai AI vật lý (Physical AI) – chuỗi cảm biến → token → mô hình AI → hành động → phản hồi, dùng các công cụ như Omniverse, Isaac ROS, OpenUSD.
Cơ sở hạ tầng AI vật lý đe dọa mô hình cloud truyền thống, yêu cầu hyperscaler như AWS, Google, Microsoft dịch chuyển sang hỗ trợ orchestrate OT/IT kết hợp.
Công bố ủng hộ Co-Packaged Optics (CPO): dùng silicon photonics tích hợp vào GPU giúp tiết kiệm điện, tăng băng thông. Dự kiến triển khai NVLink CPO từ 2026–2028.
📌 NVIDIA tại GTC 2025 đã tái định nghĩa điện toán AI qua khái niệm hiệu suất tạo token, giới thiệu chip Blackwell Ultra, framework Dynamo, và kiến trúc AI vật lý. Với roadmap rõ ràng và đầu tư lớn vào AI-native 6G, AI inference và quantum hybrid, NVIDIA định hình lại toàn bộ thị trường AI. Dự kiến, hạ tầng AI trị giá 1.000 tỷ USD sẽ triển khai đến 2028. Thách thức gồm chi phí cao, phụ thuộc hệ sinh thái và độ phức tạp trong triển khai.
https://go.abiresearch.com/lp-gtc-2025
📝 TÓM TẮT CHI TIẾT VỀ AI-RAN ALLIANCE VÀ SOVEREIGN AI
AI-RAN Alliance là sáng kiến được công bố mạnh mẽ tại GTC 2025 với mục tiêu "AI hóa" toàn bộ mạng truy cập vô tuyến (Radio Access Network - RAN).
Liên minh này có 85 thành viên trong năm 2025, tăng vọt từ chỉ 15 thành viên một năm trước, cho thấy tốc độ phát triển nhanh chóng và sự quan tâm của ngành.
NVIDIA kỳ vọng GPU sẽ thay thế phần cứng chuyên biệt như ASIC trong các hạ tầng mạng di động, mang lại hiệu suất cao hơn và khả năng lập trình linh hoạt hơn.
Điểm nhấn là hợp tác giữa NVIDIA, T-Mobile, Cisco, MITRE, Booz Allen Hamilton và ORAN Development Company (ODC) để phát triển network stack AI-native cho 6G.
Mục tiêu dài hạn là xây dựng AI-native RAN, nơi AI điều phối mọi khía cạnh của mạng: từ lập kế hoạch, cấu hình, vận hành, phân mảnh mạng, đến giám sát sức khỏe mạng.
NVIDIA cung cấp các công cụ hỗ trợ như:
Aerial Omniverse Digital Twin (AODT): mô phỏng số mạng di động.
Aerial Commercial Test Bed: môi trường thử nghiệm thực tế.
Aerial Sionna: công cụ mã nguồn mở hỗ trợ phát triển thuật toán AI cho mạng.
NVIDIA cũng ra mắt mô hình Agentic AI cho viễn thông dựa trên NIMs (NeMo framework), ứng dụng vào vận hành mạng tự động hóa toàn diện.
SoftBank công bố mô hình AI viễn thông 70 tỷ tham số, được huấn luyện 1 tháng với 4 TB dữ liệu từ 200.000 trạm phát, cho kết quả cải thiện hiệu năng mạng đáng kể.
SOVEREIGN AI – TRỤ CỘT DỮ LIỆU CHỦ QUYỀN
NVIDIA xác định AI chủ quyền (Sovereign AI) là yếu tố sống còn trong bối cảnh nhiều quốc gia muốn kiểm soát dữ liệu và AI trong biên giới quốc gia.
Công ty đã ký hợp đồng với 15 nhà mạng viễn thông tại GTC 2025 để triển khai AI factories cấp quốc gia và khu vực, vận hành như GPU cloud nội địa.
Mô hình triển khai GPU-as-a-Service (GPUaaS) giúp các telco cung cấp hạ tầng AI mà không cần cạnh tranh trực tiếp với các hyperscaler như AWS hay Google.
NVIDIA gọi các nhà mạng đang chuyển mình theo hướng AI này là "Neotelcos" – thế hệ mới của nhà mạng không chỉ kết nối, mà còn xử lý và cung cấp dịch vụ AI.
Thị trường AI sẽ chia thành 3 nhóm chính:
Hyperscalers: xử lý mô hình huấn luyện tổng quát quy mô lớn.
Neocloud providers (CoreWeave, Lambda Labs...): linh hoạt phục vụ mô hình chuyên biệt, nhu cầu nhỏ.
Neotelcos: xử lý bài toán AI mang tính quốc gia, bảo mật cao, yêu cầu không rời khỏi biên giới dữ liệu.
Sovereign AI là giải pháp để các chính phủ và doanh nghiệp địa phương triển khai AI tuân thủ pháp luật, tự chủ công nghệ, và bảo vệ dữ liệu nội địa.
NVIDIA đang xây dựng hạ tầng AI với yếu tố chủ quyền từ đầu, phù hợp với các tiêu chuẩn dữ liệu như GDPR châu Âu hay Luật An ninh mạng Việt Nam.
📌 Tại GTC 2025, NVIDIA khẳng định tham vọng dẫn đầu mạng viễn thông tương lai với AI-RAN Alliance, thúc đẩy 6G AI-native bằng GPU và phần mềm Aerial. Đồng thời, với sáng kiến Sovereign AI, công ty hợp tác với 15 telco để triển khai hạ tầng AI quốc gia. Sự kết hợp giữa AI, mạng viễn thông và chủ quyền dữ liệu tạo ra thị trường Neotelco mới, nơi AI không chỉ là công nghệ mà còn là yếu tố chiến lược quốc gia.
📝 TÓM TẮT CHI TIẾT VỀ MÔ HÌNH AI VIỄN THÔNG 70 TỶ THAM SỐ CỦA SOFTBANK
Tại GTC 2025, SoftBank công bố một trong những bước tiến lớn nhất trong ứng dụng AI cho mạng viễn thông khi giới thiệu mô hình AI chuyên biệt có 70 tỷ tham số (70B parameters).
Đây là mô hình Agentic AI chuyên dành cho mạng viễn thông, được phát triển dựa trên nền tảng NVIDIA NeMo và huấn luyện trên NVIDIA GDX SuperPOD – siêu máy tính AI của NVIDIA.
Quá trình huấn luyện kéo dài 1 tháng, sử dụng 4 Terabyte (TB) dữ liệu thực tế thu thập từ 200.000 trạm phát sóng (cells) – một trong những dataset thực tế lớn nhất từng được dùng trong AI viễn thông.
Mục tiêu của mô hình là cung cấp các tham số tối ưu hóa cho mạng di động nhằm:
Cải thiện hiệu suất vùng phủ sóng.
Giảm độ trễ.
Tăng trải nghiệm người dùng đầu cuối.
Tự động hóa các quy trình vận hành mạng: cấu hình, giám sát, xử lý sự cố, phân mảnh mạng (network slicing).
Mô hình hoạt động như một hệ thống đa tác vụ AI (Agentic AI), với các tác nhân chuyên biệt có thể phối hợp như:
Agent lập kế hoạch mạng.
Agent giám sát trạng thái mạng (NOC).
Agent cấu hình và triển khai mạng.
Agent xử lý sự cố theo thời gian thực.
Đây là minh chứng cho chiến lược AI-native RAN mà NVIDIA và AI-RAN Alliance đang thúc đẩy: các mô hình AI không chỉ bổ trợ, mà sẽ điều hành trực tiếp các hoạt động mạng viễn thông.
Việc tích hợp NeMo và GDX SuperPOD giúp SoftBank huấn luyện mô hình này một cách nhanh chóng, tiết kiệm năng lượng, đồng thời duy trì mức hiệu suất token/s cao – yếu tố quan trọng trong các mô hình yêu cầu xử lý thời gian thực.
Với mô hình này, SoftBank đang tiến gần hơn đến mục tiêu fully autonomous telco network – mạng viễn thông tự động toàn phần, không cần can thiệp thủ công từ con người.
Dự án còn đánh dấu bước đột phá trong việc áp dụng mô hình AI lớn (LLM) trong môi trường mạng, khác biệt hoàn toàn với các AI mạng truyền thống dựa vào rule-based logic hoặc heuristic.
NVIDIA coi dự án của SoftBank là hình mẫu tiên phong cho các nhà mạng khác, nhất là trong bối cảnh chủ quyền dữ liệu (sovereign AI) đang trở thành yêu cầu bắt buộc ở nhiều quốc gia.
SoftBank có thể mở đường cho các nhà mạng khác xây dựng mô hình AI nội địa, phục vụ riêng cho quốc gia mình, tạo lợi thế cạnh tranh lớn về chất lượng dịch vụ và hiệu quả vận hành.