OpenAI ra mắt Whisper V3 Turbo cho tốc độ phiên âm nhanh hơn 8 lần

  • OpenAI ra mắt Whisper V3 Turbo, mô hình phiên âm mới có tốc độ nhanh hơn 8 lần so với phiên bản large-v3 trước đó. 
  • Độ chính xác của Whisper V3 Turbo tương đương với large-v3. 
  • Kích thước của V3 Turbo nhỏ hơn khoảng một nửa so với phiên bản trước, giúp dễ dàng triển khai trên nhiều nền tảng hơn. 
  • Whisper hỗ trợ phiên âm hơn 99 ngôn ngữ và xử lý tốt nhiều loại giọng, tiếng ồn nền và ngôn ngữ kỹ thuật. 
  • Mô hình được huấn luyện trên bộ dữ liệu 680.000 giờ dữ liệu đa ngôn ngữ và đa nhiệm. 
  • Whisper xử lý âm thanh theo từng đoạn 30 giây, chuyển đổi thành log-Mel spectrograms và sử dụng các token đặc biệt để thực hiện các tác vụ như xác định ngôn ngữ, dấu thời gian cấp cụm từ và dịch thuật. 
  • Whisper là mã nguồn mở, cho phép các nhà phát triển và nhà nghiên cứu tùy chỉnh và cải tiến công nghệ. 
  • Whisper cũng có sẵn thông qua OpenAI API để tích hợp vào các ứng dụng và dịch vụ. 

📌 OpenAI đã cải thiện đáng kể tốc độ phiên âm với Whisper V3 Turbo, nhanh hơn 8 lần so với phiên bản trước mà vẫn giữ được độ chính xác, đồng thời tối ưu kích thước giúp dễ dàng triển khai. 

https://analyticsindiamag.com/ai-news-updates/openai-launches-whisper-v3-turbo-model-for-faster-transcription/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo