OpenAI lần đầu công bố mô hình lập luận nguồn mở gpt-oss-20b chạy trực tiếp trên thiết bị tích hợp vi xử lý Snapdragon, đánh dấu cột mốc quan trọng trong việc đưa AI từ đám mây về thiết bị cá nhân.
gpt-oss-20b là mô hình AI tạo sinh với 20 tỷ tham số, hỗ trợ reasoning theo kiểu chain-of-thought (CoT) mà không cần phụ thuộc vào hạ tầng đám mây.
Qualcomm xác nhận đã thực hiện kiểm thử tích hợp sớm giữa gpt-oss-20b với Qualcomm AI Engine và Qualcomm AI Stack, cho thấy khả năng lập luận mạnh mẽ hoàn toàn trên thiết bị (on-device inference).
Việc tích hợp này giúp giảm độ trễ, tăng bảo mật dữ liệu và hướng tới trải nghiệm AI cá nhân hóa, không phụ thuộc hoàn toàn vào internet hay server từ xa.
Các nhà phát triển có thể truy cập mô hình gpt-oss-20b qua các nền tảng phổ biến như Hugging Face và Ollama, hỗ trợ cài đặt và sử dụng trực tiếp trên các thiết bị chạy nền tảng Snapdragon.
Ollama cung cấp một framework nhẹ, mã nguồn mở cho mô hình LLM, hỗ trợ gpt-oss-20b chạy cùng các tính năng như web search mặc định, và chế độ turbo mode để khám phá thêm các khả năng nâng cao.
Qualcomm cho rằng đây là bước ngoặt của ngành AI, đặc biệt khi bộ nhớ thiết bị di động tiếp tục mở rộng và phần mềm ngày càng tối ưu hóa.
Trong vài năm tới, Qualcomm kỳ vọng khả năng AI tại chỗ sẽ tăng nhanh, mở đường cho trợ lý AI cá nhân hóa, riêng tư, có độ trễ cực thấp, hoạt động ngay trong lòng thiết bị người dùng.
📌 gpt-oss-20b là mô hình AI lập luận đầu tiên từ OpenAI chạy trực tiếp trên thiết bị dùng Snapdragon, với 20 tỷ tham số, hỗ trợ CoT reasoning, mang lại độ trễ thấp, bảo mật cao và trải nghiệm cá nhân hóa. Qualcomm đã kiểm thử thành công với AI Stack, mở rộng ứng dụng AI tạo sinh ngay trên thiết bị.
https://www.qualcomm.com/news/onq/2025/08/openai-model-on-device-snapdragon