Trong khi Mỹ và Trung Quốc tranh giành vị thế dẫn đầu AI, các quốc gia ở Nam bán cầu đang âm thầm xây dựng sức mạnh AI bản địa phù hợp ngôn ngữ và bối cảnh văn hóa địa phương.
Các mô hình được phát triển không chỉ nói được tiếng địa phương như Hindi, Swahili, Xhosa, Arabic… mà còn hiểu sắc thái văn hóa và ngữ cảnh xã hội vùng miền.
InkubaLM là mô hình AI tạo sinh nhỏ với chỉ 0,4 tỷ tham số, nhưng có hiệu suất gần bằng các mô hình lớn; được huấn luyện bằng 5 ngôn ngữ châu Phi.
Ở Ấn Độ, dự án BharatGen được tài trợ 235 crore (khoảng 26 triệu Euro), phát triển các mô hình AI đa ngôn ngữ như e-vikrAI, IndicTrans2.
Các startup như Krutrim, Sarvam AI, và KissanAI phát triển công cụ AI hỗ trợ nông dân và người dân bằng ngôn ngữ bản địa.
Masakhane NLP và Deep Learning Indaba tại châu Phi thúc đẩy nghiên cứu phân tán với mô hình UlizaLlama (7 tỷ tham số) hỗ trợ các bà mẹ mới sinh.
Ả Rập Xê Út phát triển ALLaM (540 tỷ token tiếng Ả Rập) và thành lập công ty HUMAIN hợp tác với Amazon và NVIDIA.
UAE có các mô hình như Jais và Noor; Qatar xây dựng Fanar Prime, huấn luyện trên 1.000 tỷ token với thiết kế phản ánh đặc trưng ngữ pháp tiếng Ả Rập.
Thách thức chính gồm: thiếu dữ liệu ngôn ngữ bản địa, hạ tầng điện toán yếu, đầu tư thấp, và luật dữ liệu chưa rõ ràng.
Dù hạn chế về tài nguyên, các mô hình AI địa phương nhấn mạnh vào tác động thực tế và sở hữu cộng đồng, không chạy theo quy mô hay danh tiếng.
📌 Các quốc gia Nam bán cầu như Ấn Độ, Nam Phi và Ả Rập Xê Út đang tạo dựng hệ sinh thái AI bản địa để thoát khỏi phụ thuộc công nghệ phương Tây. Dù đối mặt hạn chế về dữ liệu và đầu tư, các mô hình như InkubaLM, ALLaM, BharatGen hay Fanar Prime thể hiện sự đổi mới trong cách tiếp cận AI: ưu tiên tính hiệu quả, văn hóa và nhu cầu thực tiễn hơn là cạnh tranh quy mô.
https://www.nature.com/immersive/d44151-025-00085-3/index.html