- Công ty khởi nghiệp aiOla của Israel vừa ra mắt mô hình Whisper-NER, được xây dựng trên nền tảng mô hình nguồn mở Whisper của OpenAI
- Whisper-NER tích hợp hai công nghệ:
+ Nhận dạng giọng nói tự động (ASR)
+ Nhận dạng thực thể có tên (NER)
- Tính năng chính:
+ Tự động nhận diện và che giấu thông tin nhạy cảm như tên, số điện thoại, địa chỉ trong quá trình chuyển đổi
+ Xử lý đồng thời việc chuyển đổi âm thanh và bảo vệ thông tin riêng tư
+ Hỗ trợ học không cần mẫu (zero-shot learning)
+ Có thể tùy chỉnh để đánh dấu thay vì che giấu thông tin
- Mô hình được phát hành dưới giấy phép MIT, cho phép:
+ Sử dụng miễn phí
+ Tùy chỉnh và triển khai
+ Áp dụng cho mục đích thương mại
- Phương pháp huấn luyện độc đáo:
+ Sử dụng tập dữ liệu tổng hợp
+ Kết hợp dữ liệu giọng nói và văn bản NER
+ Xử lý đồng thời hai tác vụ trong một khối
- Ứng dụng thực tế:
+ Giám sát tuân thủ
+ Quản lý kho hàng
+ Đảm bảo chất lượng
+ Đặc biệt phù hợp với ngành y tế và luật
📌 aiOla phát hành mô hình AI nguồn mở Whisper-NER tích hợp khả năng chuyển đổi âm thanh và bảo vệ dữ liệu nhạy cảm trong cùng một quy trình. Mô hình được cấp phép MIT, hỗ trợ zero-shot learning và đặc biệt phù hợp với các ngành có yêu cầu bảo mật cao như y tế và luật.
https://venturebeat.com/ai/aiola-unveils-open-source-ai-audio-transcription-model-that-obscures-sensitive-info-in-realtime/