Detect-2B - mô hình phát hiện âm thanh AI thế hệ mới với độ chính xác 94%

• Resemble AI vừa ra mắt Detect-2B - thế hệ tiếp theo của mô hình phát hiện deepfake âm thanh với độ chính xác khoảng 94%.

• Detect-2B sử dụng một loạt các mô hình phụ được đào tạo trước và tinh chỉnh để kiểm tra một đoạn âm thanh và xác định xem nó có được tạo ra bởi AI hay không.

• Các mô hình phụ của Detect-2B bao gồm một mô hình biểu diễn âm thanh đóng băng với một mô-đun thích ứng được chèn vào các lớp chính của nó.

• Mô-đun thích ứng chuyển trọng tâm của các mô hình sang các artifact - những âm thanh ngẫu nhiên còn sót lại trong bản ghi âm - thường giúp phân biệt âm thanh thật với âm thanh giả.

• Detect-2B có thể dự đoán mức độ âm thanh được tạo ra bởi AI mà không cần phải đào tạo lại mô hình mỗi khi nó nghe một đoạn clip mới.

• Kiến trúc của mô hình dựa trên Mamba-SSM hay các mô hình không gian trạng thái, sử dụng mô hình xác suất ngẫu nhiên phản ứng tốt hơn với các biến số khác nhau.

• Resemble cho biết kiến trúc này hoạt động tốt với việc phát hiện âm thanh vì nó nắm bắt được các động lực khác nhau trong một đoạn âm thanh, thích ứng giữa các trạng thái của tín hiệu âm thanh và tiếp tục hoạt động ngay cả khi bản ghi âm có chất lượng kém.

• Để đánh giá mô hình, Resemble đã đưa Detect-2B qua một bộ kiểm tra bao gồm các người nói chưa từng thấy, âm thanh được tạo ra bởi deepfake và các ngôn ngữ khác nhau.

• Công ty cho biết mô hình đã phát hiện chính xác âm thanh deepfake cho sáu ngôn ngữ khác nhau với độ chính xác ít nhất 93%.

• Detect-2B sẽ có sẵn thông qua API và có thể được tích hợp vào các ứng dụng khác nhau.

• Việc xác định các deepfake ngày càng trở nên quan trọng, đặc biệt là trong bối cảnh cuộc bầu cử Tổng thống Mỹ năm 2024 sắp diễn ra.

• Các công cụ như Detect-2B có thể giúp ích rất nhiều trong việc xác định và chứng minh các deepfake trước khi chúng đến với công chúng.

• Resemble không phải là công ty duy nhất làm việc để phát hiện bản sao AI. McAfee đã ra mắt Project Mockingbird vào tháng 1 để phát hiện âm thanh AI. Meta, mặt khác, đang phát triển cách thêm thủy vân vào âm thanh được tạo ra bởi AI.

📌 Detect-2B của Resemble AI đạt độ chính xác 94% trong phát hiện âm thanh AI, sử dụng kiến trúc Mamba-SSM và mô-đun thích ứng. Mô hình hoạt động hiệu quả trên 6 ngôn ngữ, đóng vai trò quan trọng trong việc ngăn chặn deepfake âm thanh trước thềm bầu cử Mỹ 2024.

https://venturebeat.com/ai/resemble-ais-next-generation-ai-audio-detection-model-detect-2b-is-94-accurate/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo