Whisper-NER - mô hình AI nguồn mở tự động ẩn thông tin riêng tư khi chuyển đổi âm thanh thành văn bản

- Công ty khởi nghiệp aiOla của Israel vừa ra mắt mô hình Whisper-NER, được xây dựng trên nền tảng mô hình nguồn mở Whisper của OpenAI

- Whisper-NER tích hợp hai công nghệ:
  + Nhận dạng giọng nói tự động (ASR)
  + Nhận dạng thực thể có tên (NER)

- Tính năng chính:
  + Tự động nhận diện và che giấu thông tin nhạy cảm như tên, số điện thoại, địa chỉ trong quá trình chuyển đổi
  + Xử lý đồng thời việc chuyển đổi âm thanh và bảo vệ thông tin riêng tư
  + Hỗ trợ học không cần mẫu (zero-shot learning)
  + Có thể tùy chỉnh để đánh dấu thay vì che giấu thông tin

- Mô hình được phát hành dưới giấy phép MIT, cho phép:
  + Sử dụng miễn phí
  + Tùy chỉnh và triển khai
  + Áp dụng cho mục đích thương mại

- Phương pháp huấn luyện độc đáo:
  + Sử dụng tập dữ liệu tổng hợp
  + Kết hợp dữ liệu giọng nói và văn bản NER
  + Xử lý đồng thời hai tác vụ trong một khối

- Ứng dụng thực tế:
  + Giám sát tuân thủ
  + Quản lý kho hàng
  + Đảm bảo chất lượng
  + Đặc biệt phù hợp với ngành y tế và luật

📌 aiOla phát hành mô hình AI nguồn mở Whisper-NER tích hợp khả năng chuyển đổi âm thanh và bảo vệ dữ liệu nhạy cảm trong cùng một quy trình. Mô hình được cấp phép MIT, hỗ trợ zero-shot learning và đặc biệt phù hợp với các ngành có yêu cầu bảo mật cao như y tế và luật.

https://venturebeat.com/ai/aiola-unveils-open-source-ai-audio-transcription-model-that-obscures-sensitive-info-in-realtime/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo