Mistral Large 2: đối thủ đáng gờm của OpenAI và Meta với chỉ 123 tỷ tham số

• Mistral vừa ra mắt mô hình AI mới nhất Large 2 vào ngày 24/7/2024, chỉ một ngày sau khi Meta phát hành Llama 3.1 405B.

• Large 2 có 123 tỷ tham số, ít hơn 1/3 so với Llama 3.1 405B nhưng được cho là có hiệu suất vượt trội trong việc tạo mã và xử lý toán học.

• Mistral tuyên bố Large 2 nâng cao tiêu chuẩn về hiệu suất và chi phí cho các mô hình mở, dựa trên một số điểm chuẩn.

Một trong những trọng tâm chính trong quá trình đào tạo Large 2 là giảm thiểu vấn đề hallucination. Mô hình được huấn luyện để thừa nhận khi không biết điều gì đó thay vì tạo ra thông tin có vẻ hợp lý.

Large 2 có cửa sổ ngữ cảnh 128.000 token, tương đương với khoảng 300 trang sách, cho phép xử lý lượng dữ liệu lớn trong một lần nhắc.

• Mô hình hỗ trợ đa ngôn ngữ, bao gồm tiếng Anh, Pháp, Đức, Tây Ban Nha, Ý, Bồ Đào Nha, Ả Rập, Hindi, Nga, Trung Quốc, Nhật Bản và Hàn Quốc, cùng với 80 ngôn ngữ lập trình.

• Mistral cho biết Large 2 tạo ra các phản hồi ngắn gọn hơn so với các mô hình AI hàng đầu khác.

• Large 2 có sẵn trên các nền tảng đám mây lớn như Google Vertex AI, Amazon Bedrock, Azure AI Studio và IBM watsonx.ai.

• Người dùng có thể sử dụng mô hình mới trên nền tảng "le Plateforme" của Mistral dưới tên "mistral-large-2407" và dùng thử miễn phí trên đối thủ cạnh tranh ChatGPT của công ty là "le Chat".

• Mistral gần đây đã huy động được 640 triệu USD trong vòng gọi vốn Series B, do General Catalyst dẫn đầu, với định giá 6 tỷ USD.

• Mặc dù Mistral là một trong những công ty mới nhất trong lĩnh vực AI, họ đang nhanh chóng phát triển các mô hình AI tiên tiến.

• Tuy nhiên, cần lưu ý rằng các mô hình của Mistral không phải là nguồn mở theo nghĩa truyền thống - bất kỳ ứng dụng thương mại nào của mô hình đều cần giấy phép trả phí.

Large 2 và Llama 3.1 của Meta đều thiếu khả năng đa phương thức (multimodal), một lĩnh vực mà OpenAI đang dẫn đầu với khả năng xử lý đồng thời hình ảnh và văn bản.

📌 Mistral Large 2 với 123 tỷ tham số đang thách thức các mô hình AI hàng đầu từ OpenAI và Meta. Mô hình này vượt trội về hiệu suất mã hóa, toán học và có cửa sổ ngữ cảnh 128.000 token, hỗ trợ 12 ngôn ngữ tự nhiên và 80 ngôn ngữ lập trình.

https://techcrunch.com/2024/07/24/mistral-releases-large-2-meta-openai-ai-models/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo