- Mistral vừa ra mắt API kiểm duyệt nội dung mới, được tích hợp sẵn trong nền tảng chatbot Le Chat của công ty
- API được xây dựng trên mô hình Ministral 8B đã qua tinh chỉnh, có khả năng phân loại văn bản theo 9 danh mục:
+ Nội dung tình dục
+ Phân biệt đối xử và thù ghét
+ Bạo lực và đe dọa
+ Nội dung nguy hiểm và tội phạm
+ Tự làm hại bản thân
+ Sức khỏe
+ Tài chính
+ Pháp luật
+ Thông tin nhận dạng cá nhân
- API hỗ trợ nhiều ngôn ngữ bao gồm tiếng Anh, Pháp và Đức
- Hệ thống có thể áp dụng cho cả văn bản thô và hội thoại
- Mặc dù hệ thống kiểm duyệt bằng AI có tiềm năng, các nghiên cứu cho thấy vẫn tồn tại một số hạn chế:
+ Thành kiến với ngôn ngữ của người Mỹ gốc Phi
+ Đánh giá tiêu cực quá mức với nội dung về người khuyết tật
- Mistral công bố API này có độ chính xác cao nhưng thừa nhận vẫn cần cải thiện thêm
- Công ty cũng ra mắt batch API cho phép xử lý yêu cầu số lượng lớn, giúp giảm 25% chi phí sử dụng API
- Các công ty lớn khác như Anthropic, OpenAI, Google cũng đang cung cấp tính năng xử lý hàng loạt tương tự
📌 Mistral tạo bước đột phá với API kiểm duyệt mới hỗ trợ 9 danh mục phân loại và nhiều ngôn ngữ, giảm 25% chi phí qua xử lý hàng loạt. Tuy nhiên hệ thống vẫn cần khắc phục các vấn đề về thành kiến và đánh giá thiếu chính xác.
https://techcrunch.com/2024/11/07/mistral-launches-a-moderation-api/