Quá trình phát triển mô hình ngôn ngữ lớn Hanuman của Ấn Độ

- Tiến sĩ Vishnu Vardhan có nền tảng y khoa, từng làm việc cho Liên Hợp Quốc. Ông bắt đầu công ty VII vào năm 2019, tập trung vào công nghệ chăm sóc sức khỏe. 
- SML là công ty của ông chuyên xây dựng các mô hình nền tảng như Hanuman. Mục tiêu là tạo ra hệ sinh thái AI tạo sinh, cho phép các startup xây dựng ứng dụng trên nền tảng Hanuman.
- Ấn Độ cần phát triển mô hình ngôn ngữ riêng vì có nhiều ngôn ngữ đa dạng, 80% dân số không nói tiếng Anh. Hanuman hỗ trợ 22 ngôn ngữ Ấn Độ.
- Quá trình phát triển Hanuman gặp nhiều khó khăn như thiếu GPU, kinh phí. Họ phải đặt hàng GPU và sử dụng dịch vụ đám mây. Hiện có cụm 1.256 GPU.

- Hanuman, tiết kiệm chi phí hơn so với các mô hình toàn cầu khác, ước tính trị giá 10 triệu USD so với 100 triệu USD của GPT-4
- Các công ty và chính phủ Ấn Độ chưa đầu tư nhiều vào AI. Ngân sách của viện hàng đầu Ấn Độ chỉ 75 triệu USD. Nhiều nhà đầu tư thiếu hiểu biết về công nghệ sâu.
- Hanuman sẽ miễn phí khi ra mắt, chỉ hỗ trợ văn bản, chưa có hình ảnh. Họ tuyển dụng kỹ sư từ IIT và hợp tác với NASSCOM để tổ chức hackathon tuyển dụng.
- Hanuman không liên quan đến hệ sinh thái của Jio hay được Jio đầu tư. Chính phủ Ấn Độ cũng có kế hoạch phát triển mô hình ngôn ngữ lớn nhưng chưa có tiến triển.
- Tiến sĩ Vishnu cho rằng các startup Ấn Độ chưa đầu tư nhiều vào công nghệ sâu vì thiếu kinh phí và hiểu biết. Nhiều nhà đầu tư không có chuyên môn về lĩnh vực này.
- Ông hy vọng Hanuman sẽ thúc đẩy hệ sinh thái AI tạo sinh tại Ấn Độ, tạo cơ hội cho các công ty khởi nghiệp phát triển ứng dụng trên nền tảng này. Mục tiêu là giúp mọi người tiếp cận giáo dục và tri thức bình đẳng.
- Trong tương lai, SML sẽ tiếp tục đầu tư mạnh vào nghiên cứu, phát triển các tính năng như tạo hình ảnh, lập trình bằng ngôn ngữ Ấn Độ. Họ sẽ hợp tác với các công ty, tổ chức lớn để mở rộng quy mô.

📌 Hanuman là nỗ lực đầy tham vọng để xây dựng mô hình ngôn ngữ lớn đầu tiên của Ấn Độ, hỗ trợ 22 ngôn ngữ bản địa. Mặc dù gặp nhiều khó khăn về kinh phí và hạ tầng, Tiến sĩ Vishnu Vardhan và đội ngũ SML đã làm việc trong 1 năm để phát triển Hanuman, chi phí khoảng 10 triệu USD, so với khoảng 100 triệu USD của GPT-4, với tầm nhìn tạo ra hệ sinh thái AI tạo sinh rộng lớn cho các công ty khởi nghiệp Ấn Độ. 

Citations:
[1] https://www.youtube.com/watch?v=qTQ63yf8VBQ

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo