Fireworks AI Mã nguồn mở FireLLaVA
- Fireworks AI công bố mã nguồn mở FireLLaVA, phiên bản có thể sử dụng thương mại của LLaVA Model, chỉ sử dụng các mô hình nguồn mở (OSS) cho việc tạo dữ liệu và đào tạo.
- FireLLaVA là mô hình đa phương tiện (multimodal) đầu tiên được phát hành dưới Llama 2 Community Licence, cho phép sử dụng thương mại.
- Mô hình có khả năng hiểu cả văn bản và nội dung hình ảnh, hứa hẹn sự linh hoạt hơn trong ứng dụng tạo chatbot và mô tả marketing dựa trên ảnh sản phẩm.
- FireLLaVA vượt trội hơn mô hình LLaVA gốc trên 4 trong số 7 điểm chuẩn, sử dụng mô hình chỉ ngôn ngữ OSS CodeLlama 34B Instruct để tái tạo dữ liệu đào tạo.
- Mô hình được phát triển để xử lý các ứng dụng thực tế như trả lời câu hỏi dựa trên hình ảnh và giải mã nguồn dữ liệu phức tạp, cải thiện độ chính xác và độ rộng của thông tin do AI cung cấp.
- FireLLaVA cho phép các nhà phát triển tích hợp tính năng nhìn thông qua API hoàn thiện và chat hoàn thiện, tương thích với các mô hình Vision của OpenAI.
📌 Fireworks AI đã mở ra một chương mới cho AI đa phương tiện với việc công bố mã nguồn mở FireLLaVA, một bước tiến đáng kể trong việc tạo ra các mô hình ngôn ngữ-hình ảnh linh hoạt và có lợi nhuận. Với khả năng đánh bại mô hình LLaVA gốc trên một số điểm chuẩn và việc sử dụng OSS để tạo dữ liệu đào tạo, FireLLaVA không chỉ mở rộng khả năng của các ứng dụng AI mà còn tạo cơ hội cho việc tích hợp AI vào nhiều lĩnh vực thương mại.