Meta vừa ra mắt mô hình AI mới có khả năng dịch lời nói từ 101 ngôn ngữ

- Meta phát hành mô hình AI mới tên là SeamlessM4T có khả năng dịch lời nói từ 101 ngôn ngữ khác nhau.
- Mô hình này giúp thực hiện dịch thuật thời gian thực, nghĩa là dịch ngay khi từ ngữ được phát ra.
- Phương pháp truyền thống cho dịch thuật lời nói mất nhiều bước: chuyển từ lời nói thành văn bản, sau đó chuyển văn bản này sang ngôn ngữ khác và cuối cùng chuyển văn bản dịch trở thành lời nói.
- SeamlessM4T cải thiện hiệu quả, cho phép dịch trực tiếp từ lời nói ngôn ngữ này sang lời nói ngôn ngữ khác.
- Mô hình mới đạt độ chính xác cao hơn 23% so với các mô hình hiện tại.
- SeamlessM4T có thể dịch sang 36 ngôn ngữ khác, trong khi mô hình AudioPaLM của Google chỉ dịch được sang tiếng Anh.
- Công nghệ khai thác dữ liệu song song đóng vai trò quan trọng trong việc xử lý và học hỏi từ tài liệu đa ngôn ngữ.
- Các nhà nghiên cứu nhấn mạnh tầm quan trọng của dịch giả con người trong quá trình dịch, đặc biệt trong các lĩnh vực như y tế hoặc pháp lý.
- Mô hình có thể xử lý tốt hơn các ngôn ngữ phổ biến với số lượng tài liệu phong phú, nhưng gặp khó khăn với ngôn ngữ ít tài liệu hơn.
- SeamlessM4T đã được tiền huấn luyện trên hàng triệu giờ âm thanh nói để nhận diện các mẫu ngôn ngữ.
- Mô hình này là nguồn mở, khuyến khích phát triển thêm từ cộng đồng nghiên cứu.
- Một số chuyên gia cho rằng mô hình của Google vẫn nhanh và hiệu quả hơn, mặc dù không phải là nguồn mở như Seamless.
- SeamlessM4T hứa hẹn khả năng dịch thuật tức thì tương tự như “fish Babel” trong tác phẩm của Douglas Adams.
- Meta đang phát triển phiên bản mới nhanh hơn, dự kiến cạnh tranh với tốc độ dịch của con người.

📌 SeamlessM4T của Meta có thể dịch lời nói từ 101 ngôn ngữ, cải thiện độ chính xác lên đến 23%. Mô hình này được huấn luyện trên hàng triệu giờ âm thanh để đạt hiệu suất cao trong dịch thuật thời gian thực.

https://www.technologyreview.com/2025/01/15/1109994/metas-new-ai-model-can-translate-speech-from-more-than-100-languages/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo