Google ra mắt Gemma 3 - Mô hình AI vượt mặt DeepSeek-V3 và o3-mini của OpenAI với chỉ một GPU

  • Google vừa công bố Gemma 3, phiên bản tiếp theo trong dòng mô hình Gemma với trọng số mở, kế thừa từ Gemma 2 ra mắt năm ngoái.

  • Mô hình này có nhiều kích cỡ tham số khác nhau: 1B, 4B, 12B và 27B, hỗ trợ cửa sổ ngữ cảnh dài lên đến 128K token.

  • Gemma 3 có khả năng phân tích video, hình ảnh và văn bản, hỗ trợ sẵn 35 ngôn ngữ, đồng thời cung cấp hỗ trợ được huấn luyện trước cho 140 ngôn ngữ.

  • Trong đánh giá Chatbot Arena, Gemma 3 27B vượt trội hơn DeepSeek-V3, o3-mini của OpenAI và mô hình Llama 3-405B của Meta, nơi các mô hình được đánh giá thông qua so sánh song song bởi con người.

  • Gemma 3 27B đạt điểm 67,5% trên bộ đánh giá MMLU-Pro và 42,4% trên GPQA Diamond, thể hiện hiệu suất tốt so với các mô hình nhỏ khác.

  • Claude 3.5 Haiku đạt 63% trên MMLU-Pro và 41% trên GPQA Diamond, trong khi GPT-4o Mini của OpenAI đạt 65% và 43% trên cùng các bài kiểm tra.

  • Llama 3.3 70B của Meta vượt trội hơn cả với 71% trong MMLU-Pro và 50% trong GPQA Diamond, trở thành đối thủ mạnh nhất trong số các mô hình này.

  • Sức mạnh chính của Gemma-3 là hiệu quả sử dụng tài nguyên tính toán: đạt được các điểm số trên với chỉ một GPU NVIDIA H100, trong khi các mô hình khác cần đến 32 GPU.

  • Google đã điều chỉnh kiến trúc của mô hình để giảm bộ nhớ KV-cache, vốn có xu hướng tăng với ngữ cảnh dài hơn.

  • Công ty đã công bố báo cáo kỹ thuật chi tiết về các kỹ thuật được sử dụng để xây dựng mô hình, hiệu suất và các thông số kỹ thuật khác.

  • Gemma 3 có thể truy cập qua nhiều phương thức: trên web thông qua Google AI Studio, qua chatbot mặc định hoặc API, và có sẵn trên Google GenAI SDK.

  • Mô hình này cũng có thể tải về để triển khai cục bộ trên Hugging Face, Ollama và Kaggle.

  • Cùng với Gemma 3, Google cũng ra mắt ShieldGemma 2, một trình kiểm tra an toàn hình ảnh 4B tham số được xây dựng trên nền tảng của Gemma 3, cung cấp nhãn an toàn cho hình ảnh có hại liên quan đến nội dung nguy hiểm, khiêu dâm và bạo lực.

📌 Google đã tạo bước đột phá với Gemma 3 27B, vượt trội hơn nhiều mô hình lớn trong các bài kiểm tra chuẩn nhưng chỉ yêu cầu một GPU NVIDIA H100 thay vì 32 GPU như các đối thủ. Mô hình đa phương thức này hỗ trợ 140 ngôn ngữ và cửa sổ ngữ cảnh 128K token.

 

https://analyticsindiamag.com/ai-news-updates/googles-new-ai-model-outperforms-deepseek-v3-openais-o3-mini/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo