Mistral ra mắt API kiểm duyệt nội dung Ministral 8B theo 9 loại xấu độc

- Mistral vừa ra mắt API kiểm duyệt nội dung mới, được tích hợp sẵn trong nền tảng chatbot Le Chat của công ty

- API được xây dựng trên mô hình Ministral 8B đã qua tinh chỉnh, có khả năng phân loại văn bản theo 9 danh mục:
  + Nội dung tình dục
  + Phân biệt đối xử và thù ghét
  + Bạo lực và đe dọa
  + Nội dung nguy hiểm và tội phạm
  + Tự làm hại bản thân
  + Sức khỏe
  + Tài chính
  + Pháp luật
  + Thông tin nhận dạng cá nhân

- API hỗ trợ nhiều ngôn ngữ bao gồm tiếng Anh, Pháp và Đức

- Hệ thống có thể áp dụng cho cả văn bản thô và hội thoại

- Mặc dù hệ thống kiểm duyệt bằng AI có tiềm năng, các nghiên cứu cho thấy vẫn tồn tại một số hạn chế:
  + Thành kiến với ngôn ngữ của người Mỹ gốc Phi
  + Đánh giá tiêu cực quá mức với nội dung về người khuyết tật

- Mistral công bố API này có độ chính xác cao nhưng thừa nhận vẫn cần cải thiện thêm

- Công ty cũng ra mắt batch API cho phép xử lý yêu cầu số lượng lớn, giúp giảm 25% chi phí sử dụng API

- Các công ty lớn khác như Anthropic, OpenAI, Google cũng đang cung cấp tính năng xử lý hàng loạt tương tự

📌 Mistral tạo bước đột phá với API kiểm duyệt mới hỗ trợ 9 danh mục phân loại và nhiều ngôn ngữ, giảm 25% chi phí qua xử lý hàng loạt. Tuy nhiên hệ thống vẫn cần khắc phục các vấn đề về thành kiến và đánh giá thiếu chính xác.

https://techcrunch.com/2024/11/07/mistral-launches-a-moderation-api/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo