Google ra mắt Gemma 3n – mô hình AI đa phương thức tối ưu cho thiết bị di động

  • Google công bố Gemma 3n, phiên bản AI mới với kiến trúc mobile-first, tập trung vào hiệu suất trên thiết bị di động.

  • Được hỗ trợ bởi các nền tảng như Hugging Face, llama.cpp, Google AI Edge, Ollama, MLX…, Gemma 3n dễ dàng triển khai và tùy chỉnh cho các ứng dụng on-device.

  • Gemma 3n hỗ trợ đa phương thức gồm văn bản, hình ảnh, video và âm thanh.

  • Có 2 phiên bản chính:

    • E2B (5B tham số thô, footprint như mô hình 2B)

    • E4B (8B tham số thô, footprint như mô hình 4B)

  • Kiến trúc MatFormer (Matryoshka Transformer) cho phép nhúng nhiều mô hình trong một, giúp chuyển đổi linh hoạt giữa E2B và E4B hoặc tạo mô hình tùy chỉnh với công cụ Mix-n-Match.

  • Per-Layer Embeddings (PLE) giúp giảm tải bộ nhớ VRAM, chỉ cần khoảng 2GB (E2B) hoặc 4GB (E4B) cho lõi transformer.

  • Tích hợp KV Cache Sharing, tăng tốc độ xử lý chuỗi dài gấp 2 lần so với Gemma 3 4B.

  • Hỗ trợ nhận diện giọng nói (ASR)dịch giọng nói (AST) với hiệu suất cao, đặc biệt tốt cho các cặp ngôn ngữ Anh-Tây Ban Nha, Anh-Pháp…

  • Vision encoder mới MobileNet-V5:

    • Hỗ trợ độ phân giải từ 256x256 đến 768x768.

    • Xử lý video 60 FPS trên Google Pixel.

    • Nhanh hơn 13 lần so với SoViT, bộ nhớ nhỏ hơn 4 lần, giảm 46% tham số.

  • Google ra mắt Gemma 3n Impact Challenge với tổng giải thưởng 150.000 USD cho các dự án có tác động xã hội.

  • Người dùng có thể bắt đầu với Gemma 3n qua Google AI Studio, tải mô hình từ Hugging Face, Kaggle hoặc triển khai qua Cloud Run, Vertex AI, NVIDIA API…


📌 Gemma 3n là bước tiến đột phá của Google cho AI trên thiết bị di động, hỗ trợ đa phương thức với hiệu suất vượt trội. Kiến trúc MatFormer và MobileNet-V5 giúp tăng tốc tới 13 lần, giảm footprint bộ nhớ xuống còn 2-4GB. Hỗ trợ nhận diện và dịch giọng nói, xử lý hình ảnh, video tốc độ cao. Gemma 3n mở ra cơ hội xây dựng ứng dụng AI offline mạnh mẽ cho cộng đồng lập trình.

https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/

Không có file đính kèm.

31

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo