- Microsoft vừa ra mắt phiên bản tiếp theo của mô hình AI nhẹ Phi-3 Mini, mô hình đầu tiên trong số 3 mô hình nhỏ mà công ty dự định phát hành.
- Phi-3 Mini có 3.8 tỷ tham số và được huấn luyện trên tập dữ liệu nhỏ hơn so với các mô hình lớn.
- Phi-3 có hiệu suất tốt hơn phiên bản trước và có thể đưa ra phản hồi gần như tương đương với mô hình lớn hơn gấp 10 lần.
- Eric Boyd, phó chủ tịch của Microsoft Azure AI Platform, cho biết Phi-3 Mini có khả năng tương đương với các mô hình ngôn ngữ lớn như GPT-3.5.
- Các mô hình AI nhỏ có ưu điểm là đòi hỏi ít tài nguyên tính toán hơn, dễ triển khai và tùy chỉnh hơn.
- Microsoft đã xây dựng một đội ngũ tập trung vào phát triển các mô hình AI nhẹ hơn.
- Các đối thủ cạnh tranh của Microsoft cũng có các mô hình AI nhỏ riêng của họ.
- Các nhà phát triển đã huấn luyện Phi-3 với một "chương trình giảng dạy" lấy cảm hứng từ cách trẻ em học từ sách thiếu nhi.
- Phi-3 kế thừa và phát triển từ những gì các phiên bản trước đã học, với khả năng lập trình và lập luận tốt hơn.
- Mặc dù Phi-3 có một số kiến thức chung, nhưng nó không thể vượt qua GPT-4 hoặc các mô hình ngôn ngữ lớn khác về độ rộng kiến thức.
- Các công ty thường thấy rằng các mô hình nhỏ hơn như Phi-3 hoạt động tốt hơn cho các ứng dụng tùy chỉnh của họ.
📌 Phi-3 Mini của Microsoft, với 3,8 tỷ tham số, mang lại hiệu suất ấn tượng tương đương các mô hình lớn hơn gấp 10 lần. Mô hình này kế thừa khả năng từ các phiên bản trước, được huấn luyện theo phương pháp độc đáo lấy cảm hứng từ sách thiếu nhi. Mặc dù không thể vượt qua các mô hình ngôn ngữ lớn về độ rộng kiến thức, Phi-3 Mini vẫn là lựa chọn tối ưu cho các ứng dụng tùy chỉnh của doanh nghiệp.
Citations:
[1] https://www.theverge.com/2024/4/23/24137534/microsoft-phi-3-launch-small-ai-language-model