- ElevenLabs đã ra mắt trang tổng hợp giọng nói mới với thiết kế đơn giản hóa, giúp người dùng dễ dàng tạo giọng nói AI và chuyển văn bản thành giọng nói.
- Nền tảng này sở hữu các giọng nói tổng hợp và bản sao giọng nói tự nhiên nhất hiện nay. OpenAI Voice Engine có thể cạnh tranh nhưng đang trì hoãn ra mắt do lo ngại về an toàn.
- Tác giả đã thử nghiệm tạo bản sao giọng nói của mình bằng tính năng Instant Voice Cloning của ElevenLabs chỉ trong 20 phút với 3 phút âm thanh mẫu.
- Kết quả cho thấy bản sao giọng nói gần như giống hệt giọng thật, đến mức vợ tác giả không thể phân biệt được khi sử dụng tính năng speech-to-speech.
- Công nghệ này có thể được ứng dụng để thu âm cả vở kịch radio chỉ với một diễn viên, thậm chí tái hiện giọng nói của những người đã khuất.
- Tuy nhiên, nó cũng tiềm ẩn nguy cơ đánh cắp danh tính nếu kẻ xấu sử dụng bản sao giọng nói của một người khác.
- ElevenLabs đã đưa ra một số hạn chế như công cụ phát hiện clip được tạo bởi AI và công cụ bảo vệ để ngăn tạo giọng nói của các quan chức được bầu chọn.
- OpenAI cũng trì hoãn ra mắt Voice Engine để thảo luận về việc triển khai có trách nhiệm các giọng nói tổng hợp và tác động của chúng đến xã hội.
- Tuy nhiên, đã có hàng chục dự án mã nguồn mở về chuyển văn bản thành giọng nói với chất lượng gần bằng ElevenLabs nên có thể đã quá muộn để kiểm soát công nghệ này.
📌 ElevenLabs đã ra mắt công cụ nhân bản giọng nói AI ấn tượng, cho phép tạo bản sao giọng nói cá nhân chỉ trong vài phút với độ chính xác đáng kinh ngạc. Mặc dù tiềm ẩn rủi ro về đánh cắp danh tính, công nghệ này mở ra nhiều ứng dụng tích cực như cải thiện chất lượng âm thanh. Tuy nhiên, sự phổ biến của các dự án mã nguồn mở tương tự cho thấy có thể đã quá muộn để kiểm soát hoàn toàn công nghệ nhân bản giọng nói.
https://www.tomsguide.com/ai/i-cloned-my-voice-with-elevenlabs-ai-and-the-results-are-so-accurate-its-scary