Microsoft vừa ra mắt dòng mô hình AI Phi-4 mới có khả năng xử lý đồng thời văn bản, hình ảnh và giọng nói nhưng tiêu tốn ít tài nguyên tính toán hơn nhiều so với các hệ thống hiện có.
Phi-4-Multimodal chỉ có 5,6 tỷ tham số và Phi-4-Mini có 3,8 tỷ tham số, vượt trội so với các đối thủ cùng kích thước và thậm chí còn vượt qua hiệu suất của các mô hình lớn hơn gấp đôi trong một số tác vụ.
Điểm đặc biệt của Phi-4-Multimodal là kỹ thuật "hỗn hợp LoRA" cho phép xử lý đầu vào văn bản, hình ảnh và giọng nói trong một mô hình duy nhất mà không làm giảm hiệu suất.
Mô hình này đã giành vị trí đầu bảng trên Hugging Face OpenASR với tỷ lệ lỗi từ chỉ 6,14%, vượt qua cả các hệ thống nhận dạng giọng nói chuyên biệt như WhisperV3.
Phi-4-Mini thể hiện khả năng đặc biệt trong các tác vụ dựa trên văn bản. Trên tiêu chuẩn toán học GSM-8K, nó đạt 88,6%, vượt qua hầu hết các mô hình 8 tỷ tham số, và trên tiêu chuẩn MATH đạt 64%, cao hơn nhiều so với đối thủ cùng kích thước.
Công ty Capacity đã sử dụng các mô hình Phi và báo cáo tiết kiệm chi phí gấp 4,2 lần so với quy trình làm việc cạnh tranh trong khi vẫn đạt được kết quả chất lượng tương đương hoặc tốt hơn.
Các mô hình Phi-4 được thiết kế để hoạt động trên phần cứng tiêu chuẩn hoặc tại "biên" - trực tiếp trên thiết bị thay vì trong trung tâm dữ liệu đám mây - nhằm giảm chi phí, độ trễ và duy trì quyền riêng tư dữ liệu.
Microsoft đã đưa Phi-4 lên nhiều nền tảng bao gồm Azure AI Foundry, Hugging Face và Nvidia API Catalog, giúp phổ cập AI cho nhiều đối tượng sử dụng.
Masaya Nishimaki, giám đốc tại công ty AI Nhật Bản Headwaters, đánh giá AI biên hoạt động xuất sắc ngay cả trong môi trường kết nối mạng không ổn định hoặc nơi bảo mật là tối quan trọng.
Phi-4 đại diện cho sự thay đổi tư duy về AI, chứng minh rằng AI không chỉ dành cho những người có máy chủ lớn nhất và ngân sách lớn nhất, mà có thể hoạt động ở bất cứ đâu, cho bất kỳ ai.
📌 Microsoft phá vỡ quy ước "càng lớn càng tốt" trong AI với mô hình Phi-4 chỉ từ 3,8-5,6 tỷ tham số nhưng xử lý được đa phương thức, vượt trội trên nhiều tiêu chuẩn so với mô hình lớn gấp đôi, tiết kiệm chi phí đến 4,2 lần và có thể triển khai trực tiếp tại biên.
https://venturebeat.com/ai/microsofts-new-phi-4-ai-models-pack-big-performance-in-small-packages/