- Có nhiều nỗ lực trong việc phát triển trợ lý giọng nói AI nguồn mở như Rhasspy, Mycroft và Jasper, với mục tiêu tạo ra trải nghiệm bảo mật, hoạt động ngoại tuyến mà không giảm chức năng.
- Phát triển trợ lý giọng nói nguồn mở gặp nhiều khó khăn do thách thức từ dự án nguồn mở và khó khăn trong việc lập trình trợ lý.
- Công nghệ trợ lý giọng nói như Google Assistant, Siri và Alexa có nhiều năm R&D và cơ sở hạ tầng lớn.
- LAION, tổ chức phi lợi nhuận Đức, chịu trách nhiệm duy trì một số bộ dữ liệu huấn luyện AI phổ biến nhất thế giới, đã công bố sáng kiến mới, BUD-E, nhằm xây dựng trợ lý giọng nói "hoàn toàn mở" có thể chạy trên phần cứng của người tiêu dùng.
- BUD-E được thiết kế để tận dụng công nghệ GenAI mới nổi, đặc biệt là các mô hình ngôn ngữ lớn (LLMs) như ChatGPT của OpenAI.
- BUD-E đã có thể tải xuống và cài đặt từ GitHub trên Ubuntu hoặc Windows PC (macOS sẽ sớm có), nhưng vẫn đang trong giai đoạn đầu.
📌 Tổ chức phi lợi nhuận LAION của Đức đang tiên phong trong việc phát triển một trợ lý giọng nói mở, BUD-E, nhằm mục tiêu tạo ra một giải pháp bảo mật và hoạt động ngoại tuyến mà không giảm chức năng. Dự án này đặc biệt quan trọng trong bối cảnh các công nghệ trợ lý giọng nói hiện tại như Google Assistant, Siri và Alexa đều yêu cầu cơ sở hạ tầng lớn và nhiều năm R&D. BUD-E không chỉ nhấn mạnh vào việc tạo ra một trợ lý giọng nói mở mà còn tận dụng các công nghệ AI tạo sinh mới nổi, mở ra khả năng tùy chỉnh và mở rộng không giới hạn cho người dùng và nhà phát triển.
Citations:
[1] https://techcrunch.com/2024/02/15/this-german-nonprofit-is-building-an-open-voice-assistant-that-anyone-can-use/