CTO của AMD: Suy luận AI sẽ dịch chuyển khỏi trung tâm dữ liệu và ngày càng nhiều đến thiết bị biên

  • CTO AMD, Mark Papermaster dự đoán AI phơi nhiễm sẽ chuyển từ trung tâm dữ liệu sang thiết bị biên như điện thoại, laptop, cảm biến nhà máy, đèn giao thông thông minh.

  • Quá trình suy luận AI, tức giai đoạn AI tạo ra đầu ra (trả lời, tạo ảnh…), đã vượt qua giai đoạn đào tạo mô hình, trở thành phân khúc tăng trưởng nhất trong tính toán tăng tốc.

  • AMD xem đây là cơ hội lớn để giành thị phần từ Nvidia, đặc biệt tại thiết bị biên, nơi chưa có hãng nào dẫn đầu tuyệt đối.

  • Papermaster cho rằng lý do thúc đẩy AI lên thiết bị biên là nhu cầu tạo nội dung nhanh, độ trễ thấp, riêng tư như dịch tự động, căn chỉnh hình ảnh, làm PowerPoint bằng lệnh nói… ngay tại máy tính mà không cần kết nối đám mây.

  • AMD cùng Microsoft và các đối tác chuẩn bị tung ra dòng AI PC hỗ trợ tính năng AI cục bộ trong 6 tháng tới.

  • Ngoài ra, ứng dụng tự động hóa đang xuất hiện mạnh, ví dụ xe tự hành, nhà máy tự động.

  • Papermaster nhận định đến năm 2030, phần lớn tác vụ suy luận AI sẽ thực hiện tại thiết bị biên, phụ thuộc vào sự xuất hiện của ứng dụng AI đột phá ("killer app") như trường hợp App Store thúc đẩy bùng nổ ứng dụng di động.

  • Ông nhấn mạnh 2 xu hướng: một mặt các mô hình AI ngày càng mạnh, cần nhiều tính toán hơn; mặt khác, đổi mới giúp mô hình tối ưu hiệu suất, nhỏ gọn hơn, ví dụ DeepSeek (một bước ngoặt hiệu suất mô hình).

  • Papermaster tin cả hai hướng này sẽ song song phát triển, không làm các thiết bị hiện tại lỗi thời, mà cải tiến liên tục tăng giá trị AI biên.

📌 AI suy luận đang chuyển dịch từ trung tâm dữ liệu sang thiết bị biên như laptop, điện thoại, tạo ra cơ hội lớn cho AMD cạnh tranh Nvidia. AMD kỳ vọng trong 3-6 năm tới sẽ xuất hiện ứng dụng AI đột phá, thúc đẩy hơn 50% tác vụ AI thực hiện tại biên. Xu hướng vừa tăng hiệu năng, vừa tối ưu hóa mô hình sẽ diễn ra song song.

https://www.businessinsider.com/ai-workloads-transition-inference-amd-mark-papermaster-edge-devices-2025-4

 

Tôi sẽ dịch bài viết từ tiếng Anh sang tiếng Việt.

Giám đốc công nghệ của AMD nói rằng suy luận AI sẽ dịch chuyển khỏi trung tâm dữ liệu và ngày càng nhiều đến điện thoại và máy tính xách tay

Bởi Emma Cosgrove

Mark Papermaster là Giám đốc công nghệ của AMD. Hội nghị thượng đỉnh đổi mới năng lượng ARPA-E 2025 Ngày 19/4/2025, 9:00 AM UTC

AMD nhìn nhận sự chuyển dịch suy luận AI như một cơ hội để giành thị phần từ Nvidia. Suy luận AI sẽ di chuyển từ trung tâm dữ liệu đến các thiết bị biên, như điện thoại thông minh, theo lời Giám đốc công nghệ của AMD. Mark Papermaster kỳ vọng một "ứng dụng đột phá" AI trong 3 đến 6 năm tới.

Phần lớn khối lượng công việc trí tuệ nhân tạo đang chuyển từ đào tạo sang suy luận là tin tuyệt vời cho AMD, theo lời Giám đốc công nghệ của công ty này.

Khối lượng công việc đào tạo AI — những công việc tạo nên nhiệm vụ khổng lồ xây dựng các mô hình ngôn ngữ lớn, thấm nhuần phong cách viết hoặc nói quen thuộc, và kiến thức — từng chiếm phần lớn công việc tính toán AI. Suy luận là quá trình tính toán xảy ra khi AI tạo ra đầu ra như trả lời câu hỏi hoặc tạo hình ảnh.

Khó xác định chính xác khi nào sự chuyển đổi này xảy ra — có lẽ vào khoảng năm ngoái. Nhưng hiện tại và có thể trong tương lai, suy luận sẽ tiếp tục là phân khúc lớn nhất của điện toán tăng tốc. Kể từ đó, các giám đốc điều hành của AMD đã đẩy mạnh cơ hội giành thị phần từ Nvidia.

"Mọi người thích công việc chúng tôi đã làm trong lĩnh vực suy luận," CEO Lisa Su đã nói trong cuộc gọi báo cáo thu nhập của công ty vào tháng 2.

AI ở quy mô lớn hoàn toàn là về suy luận.

Nếu bạn hỏi Mark Papermaster, Giám đốc công nghệ của AMD, về hướng phát triển từ đó, ông sẽ nói với bạn rằng khi suy luận phát triển, nó đang hướng đến các thiết bị biên

"Thiết bị biên" là thuật ngữ ngành công nghiệp chỉ các máy tính hoạt động bên ngoài trung tâm dữ liệu. Điện thoại và máy tính xách tay của chúng ta đều thuộc nhóm này, nhưng cũng có thể là đèn giao thông thông minh hoặc cảm biến trong nhà máy. Công việc của Papermaster là đảm bảo AMD đang đi đúng hướng để đáp ứng nhu cầu tính toán AI trên các thiết bị khi nó phát triển.

AMD đã phải đuổi theo trong trung tâm dữ liệu kể từ khi Nvidia có lợi thế đi trước 10 năm. Nhưng ở các thiết bị cạnh? Sân chơi đang mở hơn.

Business Insider đã hỏi Papermaster về cách ông nghĩ về tương lai của AI cầm tay.

Cuộc phỏng vấn này đã được biên tập để rõ ràng và ngắn gọn.

Ứng dụng nổi bật nhất cho điện toán AI trên các thiết bị biên như máy tính xách tay và điện thoại là gì?

Trường hợp sử dụng bạn bắt đầu thấy là tạo nội dung cục bộ, tức thời, độ trễ thấp.

Tại sao chúng ta sử dụng máy tính? Chúng ta sử dụng để giao tiếp và tạo nội dung. Khi chúng ta đang nói chuyện — đây là sự kiện Microsoft Teams — AI đang chạy bên dưới. Tôi có thể có một sự điều chỉnh sao cho nếu tôi nhìn sang hai bên, bạn chỉ thấy tôi ở giữa. Đó là một tùy chọn. Tôi có thể bật dịch tự động — bạn có thể ở Ả Rập Saudi và không nói tiếng Anh, và chúng ta có thể có bản dịch đồng thời khi những thứ này thực sự được nhúng và hoạt động, điều này sắp xảy ra.

Thực sự kinh ngạc những gì sắp tới vì ngay trên máy tính của bạn, bạn sẽ có thể mô tả bằng lời nói: "Này, tôi đang xây dựng một PowerPoint. Tôi cần cái này. Tôi cần những tính năng này. Tôi đang chạy Adobe. Đây là những gì tôi muốn."

Hiện nay, tôi phải quay lại đám mây. Tôi phải chạy khối lượng tính toán lớn, nặng nề. Điều này tốn kém hơn và mất nhiều thời gian hơn.

Đó là ví dụ tức thời nổi bật, và đây là lý do tại sao chúng tôi đã đầu tư mạnh vào máy tính AI. Điều này sắp xảy ra từ Microsoft và những công ty khác trong 6 tháng tới.

Ứng dụng khác mà chúng tôi đã thấy là bất cứ thứ gì tự động. Bắt đầu với ô tô, nhưng vượt xa ô tô. Đó là sàn nhà máy tự động.

Giả sử năm 2030 — bao nhiêu phần trăm suy luận được thực hiện ở thiết bị biên?

Theo thời gian, sẽ là đa số. Tôi không thể nói khi nào sự chuyển đổi xảy ra vì nó được thúc đẩy bởi các ứng dụng — sự phát triển của các ứng dụng đột phá có thể chạy trên thiết bị cạnh. Chúng ta chỉ đang thấy đầu mũi nhọn bây giờ, nhưng tôi nghĩ điều này sẽ thay đổi nhanh chóng.

Bạn có thể xem điện thoại như một ví dụ. Những chiếc điện thoại đó chỉ là một trợ giúp tốt cho đến khi App Store ra đời và làm cho việc tạo ra hàng tấn ứng dụng trên điện thoại của bạn thực sự dễ dàng.

Hiện tại, những việc trước đây luôn được thực hiện với điện toán hiệu suất cao hơn có thể được thực hiện cục bộ hơn. Những việc được thực hiện trên đám mây có thể được thực hiện cục bộ. Khi chúng ta bắt đầu có các ứng dụng đột phá, chúng ta sẽ bắt đầu thấy sự chuyển dịch đó diễn ra rất nhanh. Vì vậy, điều đó sẽ xảy ra trong 3 đến 6 năm tới, không còn nghi ngờ gì nữa.

Tôi liên tục gặp các ví dụ cho thấy cách các mô hình ngày càng tốt hơn là cứ chất thêm nhiều năng lực tính toán suy luận. Làm sao bạn biết rằng 3 năm nữa, sẽ không có đột phá nào khiến tất cả các thiết bị đang được thiết kế hiện nay hoàn toàn lỗi thời?

Mọi thứ bạn đang mô tả là để đạt được khả năng và độ chính xác cao hơn. Điều đó không có nghĩa là những gì chúng ta có không hữu ích. Nó sẽ liên tục cải thiện, và sự cải thiện diễn ra theo hai hướng.

Một hướng là trở nên chính xác hơn. Nó có thể làm nhiều việc hơn, và thường đòi hỏi nhiều tính toán hơn. Có một hướng khác chạy song song, nói rằng, "Làm thế nào tôi có thể tối ưu hóa hơn?"

Tôi gọi đó là khoảnh khắc DeepSeek. Nó đã làm chấn động thế giới. Hiện nay, tất cả mọi người — Microsoft, Meta, Google — đang làm cho các mô hình của họ hiệu quả hơn. Vì vậy, bạn có cả hai ví dụ: nơi nó đòi hỏi ngày càng nhiều tính toán và nơi có sự đổi mới thúc đẩy ngày càng nhiều hiệu quả. Điều đó sẽ không thay đổi.

Không có file đính kèm.

10

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo