- Microsoft đã công bố ba mô hình Phi-3.5 mới, cho thấy sự phát triển mạnh mẽ trong lĩnh vực AI.
- Ba mô hình này bao gồm Phi-3.5-mini-instruct (3.82 tỷ tham số), Phi-3.5-MoE-instruct (41.9 tỷ tham số) và Phi-3.5-vision-instruct (4.15 tỷ tham số), mỗi mô hình phục vụ cho các tác vụ khác nhau như lý luận cơ bản, lý luận mạnh mẽ và phân tích hình ảnh.
- Tất cả ba mô hình đều có sẵn để các nhà phát triển tải về, sử dụng và tùy chỉnh trên Hugging Face với giấy phép MIT từ Microsoft, cho phép sử dụng thương mại và sửa đổi mà không có hạn chế.
- Các mô hình này đã đạt được hiệu suất gần như tốt nhất trong nhiều bài kiểm tra chuẩn bên thứ ba, vượt qua cả Google’s Gemini 1.5 Flash, Meta’s Llama 3.1 và OpenAI’s GPT-4o trong một số trường hợp.
- Phi-3.5 Mini Instruct là mô hình nhẹ, tối ưu cho các môi trường hạn chế về bộ nhớ và tính toán, lý tưởng cho các tác vụ như sinh mã, giải toán và lý luận logic.
- Mô hình Phi-3.5 MoE là mô hình đầu tiên của Microsoft trong lớp này, kết hợp nhiều loại mô hình khác nhau, mỗi loại chuyên về các tác vụ khác nhau.
- Mô hình Phi-3.5 Vision Instruct tích hợp khả năng xử lý văn bản và hình ảnh, phù hợp cho các tác vụ như hiểu biết hình ảnh tổng quát, nhận diện ký tự quang học và tóm tắt video.
- Phi-3.5 Mini Instruct được huấn luyện trên 3.4 triệu tỷ token, sử dụng 512 GPU H100-80G trong 10 ngày; Phi-3.5 Vision Instruct huấn luyện trên 500 tỷ token với 256 GPU A100-80G trong 6 ngày; Phi-3.5 MoE huấn luyện trên 4.9 triệu tỷ token với 512 GPU H100-80G trong 23 ngày.
- Tất cả các mô hình Phi-3.5 đều được phát hành dưới giấy phép mã nguồn mở MIT, cho thấy cam kết của Microsoft trong việc hỗ trợ cộng đồng mã nguồn mở.
📌 Microsoft đã ra mắt ba mô hình Phi-3.5 với hiệu suất cao, cho phép phát triển AI đa phương tiện và ngôn ngữ. Các mô hình này được huấn luyện trên hàng triệu tỷ token và có sẵn dưới giấy phép mã nguồn mở, thúc đẩy sự đổi mới trong ngành công nghiệp AI.
https://venturebeat.com/ai/microsoft-releases-powerful-new-phi-3-5-models-beating-google-openai-and-more/