• Microsoft vừa phát triển một công cụ AI tổng hợp giọng nói mới có tên VALL-E 2, được mô tả là "quá thực" đến mức công ty quyết định không công bố rộng rãi.
• Theo bài báo nghiên cứu, VALL-E 2 được cho là hệ thống text-to-speech đầu tiên đạt được "ngang bằng con người" (human parity).
• Công cụ này có khả năng tạo ra giọng nói con người chân thực và đáng tin cậy trực tiếp từ văn bản đầu vào.
• Microsoft khẳng định họ không có kế hoạch tích hợp VALL-E 2 vào bất kỳ sản phẩm nào hoặc mở rộng quyền truy cập cho công chúng.
• Trang web của Microsoft nêu rõ đây chỉ là "để trình diễn nghiên cứu" và hiện tại không có kế hoạch phát hành rộng rãi.
• Không có mẫu âm thanh nào được công bố, nên công chúng không thể đánh giá chất lượng thực tế của VALL-E 2.
• Bài đăng trên blog của Microsoft cung cấp nhiều biểu đồ và thuật ngữ kỹ thuật để minh họa cho công nghệ này.
• Các nhà nghiên cứu cho rằng nếu VALL-E 2 thực sự tốt như họ mô tả, có lẽ việc không công bố rộng rãi là quyết định đúng đắn.
• Đây không phải lần đầu tiên Microsoft phát triển công nghệ AI gây tranh cãi. Trước đó, họ đã phải đóng cửa chatbot Tay vì phát ngôn gây sốc.
• Quyết định không công bố VALL-E 2 cho thấy Microsoft đang thận trọng hơn trong việc phát triển và triển khai các công nghệ AI tiên tiến.
• Việc giữ bí mật về VALL-E 2 cũng đặt ra câu hỏi về tính minh bạch trong nghiên cứu AI và trách nhiệm của các công ty công nghệ lớn.
📌 Microsoft phát triển AI tổng hợp giọng nói VALL-E 2 đạt "ngang bằng con người" nhưng quyết định không công bố vì quá nguy hiểm. Quyết định này thể hiện sự thận trọng của công ty trong phát triển AI tiên tiến, đồng thời đặt ra vấn đề về tính minh bạch trong nghiên cứu AI.
https://sea.mashable.com/tech/33381/microsoft-made-an-ai-voice-so-real-its-too-dangerous-to-release