Hugging Face chứng kiến sự bùng nổ của hàng nghìn mô hình Llama 3

- Meta đã phát hành phiên bản sớm của mô hình ngôn ngữ lớn mới nhất, Llama 3, và nhận được sự đón nhận rất lớn từ cộng đồng.
- Hugging Face đã có hơn 1000 biến thể của Llama 3 được chia sẻ công khai và dự kiến sẽ đạt 10.000 biến thể vào cuối tuần tới.
- Llama 3 bao gồm một bộ tạo sinh hình ảnh có thể cập nhật ảnh theo thời gian thực khi người dùng nhập lệnh.
- Meta phát hành hai phiên bản của Llama 3: một với 8 tỷ tham số và một với 70 tỷ tham số.
- Cả hai kích thước của Llama 3 đều vượt trội hơn các mô hình cùng kích thước như Gemma và Gemini của Google, Mistral 7B và Claude 3 của Anthropic trên một số bài kiểm tra đánh giá.
- Mô hình 8B của Llama 3 được cho là vượt trội hơn mô hình 70B của Llama 2 trên các bài đánh giá.
- Số lượng token trong Llama 3 đã tăng gấp 4 lần, từ 32.000 (Llama 2) lên 128.000, giúp nén chuỗi hiệu quả hơn, trích dẫn ít token hơn 15% và mang lại hiệu suất tốt hơn.
- Andrej Karpathy, giám đốc AI tại Tesla, ủng hộ việc phát hành các mô hình cơ sở và tinh chỉnh với kích thước 8B và 70B, đồng thời nhấn mạnh sự cần thiết của các mô hình nhỏ hơn cho mục đích giáo dục, kiểm thử đơn vị và ứng dụng nhúng.
- GroqInc giới thiệu 'Llama 3 Researcher', cung cấp Llama 3 8B với tốc độ 876 token/giây, nhanh nhất trong số các mô hình được đánh giá.
- Groq đang tạo ra 800 token mỗi giây trên Llama 3, mở ra khả năng cho các trường hợp sử dụng mới với nhiều hành động diễn ra đồng thời.

📌 Llama 3 của Meta đã tạo ra một làn sóng mới trong cộng đồng AI với hơn 1000 biến thể được chia sẻ trên Hugging Face chỉ trong một tuần và dự kiến sẽ đạt 10.000 biến thể vào cuối tuần tới. Mô hình này vượt trội hơn các đối thủ cùng kích thước, đạt tốc độ token ấn tượng lên tới 876 token/giây và hứa hẹn mở ra nhiều khả năng ứng dụng mới nhờ khả năng xử lý đồng thời nhiều hành động.

Citations:
[1] https://analyticsindiamag.com/hugging-face-already-has-1000s-of-llama-3-models-and-counting/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo