OpenAI đang phát triển các công cụ mới để phát hiện hình ảnh và âm thanh do AI của chính OpenAI tạo ra

- OpenAI giới thiệu các phương pháp sáng tạo để xác định nguồn gốc nội dung được tạo bởi các mô hình AI của họ, cụ thể là DALL-E và Voice Engine.
- Công ty đang phát triển bộ phân loại hình ảnh dựa trên AI để xác định xem một hình ảnh có được tạo bởi DALL-E 3 hay không. Bộ phân loại này duy trì độ chính xác cao ngay cả khi hình ảnh bị cắt xén, nén hoặc thay đổi độ bão hòa.
- Tuy nhiên, khả năng phân biệt hình ảnh do DALL-E 3 tạo ra với hình ảnh từ các mô hình AI khác như Midjourney chưa thực sự ấn tượng, chỉ nhận diện được 5-10% hình ảnh.
- Trước đây, OpenAI đã thêm các thủy vân siêu dữ liệu vào hình ảnh, bao gồm thông tin về quyền sở hữu và quá trình tạo nội dung.
- OpenAI là thành viên của Liên minh vì Nguồn gốc và Thẩm quyền Nội dung (C2PA) cùng với các công ty như Microsoft và Adobe. Tháng này, OpenAI đã tham gia ủy ban chỉ đạo của C2PA.
- OpenAI cũng bắt đầu tích hợp thủy vân vào các clip được tạo bởi Voice Engine, nền tảng chuyển văn bản thành giọng nói hiện đang trong giai đoạn xem trước hạn chế.
- Cả bộ phân loại hình ảnh và tín hiệu thủy vân âm thanh vẫn đang được tinh chỉnh. OpenAI đang thu thập phản hồi từ người dùng để đánh giá hiệu quả của chúng.
- Các nhà nghiên cứu và nhóm báo chí phi lợi nhuận có thể đánh giá bộ phân loại hình ảnh bằng cách áp dụng nó vào nền tảng truy cập nghiên cứu của OpenAI.

📌 OpenAI đang phát triển các công cụ mới để phát hiện và xác minh nguồn gốc nội dung do AI tạo ra, bao gồm bộ phân loại hình ảnh với độ chính xác cao và thủy vân âm thanh. Tuy nhiên, khả năng phân biệt hình ảnh từ các mô hình AI khác nhau vẫn cần cải thiện. OpenAI cũng hợp tác với C2PA để thúc đẩy tính minh bạch trong việc tạo nội dung AI.

Citations:
[1] https://www.theverge.com/2024/5/7/24151482/openai-image-detection-ai-watermarking-audio

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo