OpenAI ra mắt Whisper V3 Turbo cho tốc độ phiên âm nhanh hơn 8 lần
- OpenAI ra mắt Whisper V3 Turbo, mô hình phiên âm mới có tốc độ nhanh hơn 8 lần so với phiên bản large-v3 trước đó.
- Độ chính xác của Whisper V3 Turbo tương đương với large-v3.
- Kích thước của V3 Turbo nhỏ hơn khoảng một nửa so với phiên bản trước, giúp dễ dàng triển khai trên nhiều nền tảng hơn.
- Whisper hỗ trợ phiên âm hơn 99 ngôn ngữ và xử lý tốt nhiều loại giọng, tiếng ồn nền và ngôn ngữ kỹ thuật.
- Mô hình được huấn luyện trên bộ dữ liệu 680.000 giờ dữ liệu đa ngôn ngữ và đa nhiệm.
- Whisper xử lý âm thanh theo từng đoạn 30 giây, chuyển đổi thành log-Mel spectrograms và sử dụng các token đặc biệt để thực hiện các tác vụ như xác định ngôn ngữ, dấu thời gian cấp cụm từ và dịch thuật.
- Whisper là mã nguồn mở, cho phép các nhà phát triển và nhà nghiên cứu tùy chỉnh và cải tiến công nghệ.
- Whisper cũng có sẵn thông qua OpenAI API để tích hợp vào các ứng dụng và dịch vụ.
📌 OpenAI đã cải thiện đáng kể tốc độ phiên âm với Whisper V3 Turbo, nhanh hơn 8 lần so với phiên bản trước mà vẫn giữ được độ chính xác, đồng thời tối ưu kích thước giúp dễ dàng triển khai.
https://analyticsindiamag.com/ai-news-updates/openai-launches-whisper-v3-turbo-model-for-faster-transcription/