- Google giới thiệu RecurrentGEMM, một mô hình ngôn ngữ AI tiên tiến có thể triển khai trên các thiết bị biên với tài nguyên hạn chế như điện thoại di động và máy tính bảng.
- RecurrentGEMM sử dụng kiến trúc mới gọi là "recurrent GEMM" (GEneral Matrix Multiplication - nhân ma trận tổng quát), cho phép mô hình đạt hiệu suất cao với kích thước nhỏ gọn.
- Mô hình này được huấn luyện trên tập dữ liệu khổng lồ 1,5 nghìn tỷ token, bao gồm các trang web công khai và sách, giúp nó có khả năng hiểu và tạo ra ngôn ngữ tự nhiên ở trình độ cao.
- RecurrentGEMM chỉ nặng 20MB, nhỏ hơn đáng kể so với các mô hình ngôn ngữ khác như GPT-3 (175B) hay PaLM (540B), nhưng vẫn đạt được hiệu suất tương đương trên nhiều tác vụ xử lý ngôn ngữ tự nhiên.
- Với RecurrentGEMM, người dùng có thể trải nghiệm AI tương tác tự nhiên ngay trên thiết bị của mình mà không cần kết nối internet liên tục, đảm bảo quyền riêng tư và bảo mật dữ liệu.
- Google đã thử nghiệm RecurrentGEMM trên nhiều ứng dụng như chatbot, trợ lý ảo, dịch thuật, tóm tắt văn bản, và đạt kết quả rất khả quan.
- Trong tương lai, công nghệ này hứa hẹn sẽ mở ra nhiều khả năng ứng dụng mới cho AI trên các thiết bị biên, từ điện thoại, máy tính bảng, đến cả robot, xe tự lái.
📌 RecurrentGEMM của Google là một bước tiến lớn trong việc đưa AI ngôn ngữ tiên tiến lên các thiết bị biên. Với kích thước chỉ 20MB nhưng hiệu suất cao, mô hình này hứa hẹn mang đến trải nghiệm AI tương tác tự nhiên, bảo mật ngay trên thiết bị cho hàng tỷ người dùng.
Citations:
[1] https://venturebeat.com/ai/googles-recurrentgemma-brings-advanced-language-ai-to-edge-devices/