Latam-GPT là mô hình ngôn ngữ lớn nguồn mở đầu tiên phát triển riêng cho Mỹ Latinh, do Trung tâm Trí tuệ nhân tạo Quốc gia Chile (CENIA) dẫn dắt nhằm đạt độc lập công nghệ.
Dự án mang tính hợp tác khu vực, kết nối 33 đối tác chiến lược tại Mỹ Latinh và Caribe, cùng sự quan tâm ngày càng tăng từ chính phủ.
Khối dữ liệu huấn luyện hơn 8 terabyte (tương đương hàng triệu cuốn sách), bao gồm 2.645.500 tài liệu từ 20 quốc gia Mỹ Latinh và Tây Ban Nha.
Phân bổ dữ liệu: Brazil dẫn đầu 685.000 tài liệu, Mexico 385.000, Tây Ban Nha 325.000, Colombia 220.000 và Argentina 210.000, phản ánh quy mô và mức độ phát triển số.
Latam-GPT có 50 tỷ tham số, sức mạnh tương đương GPT-3.5, có thể thực hiện các nhiệm vụ như suy luận, dịch thuật và liên kết phức tạp.
Trọng tâm ban đầu: mô hình ngôn ngữ phục vụ đặc thù khu vực, hiểu rõ ngôn ngữ, văn hóa, lịch sử, thậm chí hướng tới các ngôn ngữ bản địa (Mapuche, Rapanui, Guaraní).
CENIA nhấn mạnh không cạnh tranh trực tiếp với OpenAI hay Google, mà tạo công cụ AI từ cốt lõi cho Mỹ Latinh.
Hạ tầng siêu máy tính đặt tại Đại học Tarapacá (Chile), đầu tư 10 triệu USD, gồm 12 node với 8 GPU NVIDIA H200 mỗi node – cụm tính toán mạnh nhất khu vực.
Mô hình mở cho phép các tổ chức tùy biến: ví dụ Colombia có thể ứng dụng trong giáo dục, Brazil trong y tế, hay lĩnh vực nông nghiệp, văn hóa.
Mục tiêu 2030: Mỹ Latinh trở thành nhà phát triển công nghệ AI, không chỉ là người tiêu dùng, xây dựng thế hệ trẻ có tri thức gắn liền với văn hóa khu vực.
Dự án cũng thúc đẩy nghiên cứu khoa học, giúp học giả tiếp cận công cụ thử nghiệm tương tự như “cộng hưởng từ” trong y tế.
Thách thức chính: cần cân bằng dữ liệu quốc gia, mở rộng lĩnh vực nội dung, giải quyết vấn đề hạ tầng điện toán, và chuẩn bị giáo dục kỹ năng mới cho thế hệ trẻ.
📌 Latam-GPT là bước tiến chiến lược cho độc lập công nghệ Mỹ Latinh với 50 tỷ tham số, dữ liệu hơn 2,6 triệu tài liệu từ 20 quốc gia và Tây Ban Nha, được vận hành trên hạ tầng siêu máy tính 10 triệu USD tại Chile. Dự án nhấn mạnh nguồn mở, tính hợp tác và bản sắc văn hóa, hướng tới ứng dụng trong giáo dục, y tế, nông nghiệp và phát triển ngôn ngữ bản địa. Mục tiêu dài hạn: đến 2030, Mỹ Latinh trở thành nhà sáng tạo AI thay vì chỉ tiêu dùng.
https://www.wired.com/story/latam-gpt-the-free-open-source-and-collaborative-ai-of-latin-america/