UAE dùng AI để xây kho ngôn ngữ tiếng Ả Rập lớn nhất thế giới

 

  • UAE triển khai chiến lược quốc gia bảo tồn và hiện đại hóa tiếng Ả Rập bằng AI, kết hợp bảo tồn di sản ngôn ngữ với nâng cao hiện diện kỹ thuật số toàn cầu.

  • Từ điển lịch sử tiếng Ả Rập: do Học viện Ngôn ngữ Ả Rập Sharjah phát triển, gồm 127 tập, 20 triệu từ, tích hợp GPT cho tra cứu tương tác, hỗ trợ đọc, viết, chuyển đổi nội dung thành video và tính năng cộng tác qua Emirates Scholar Research Centre.

  • Kho tri thức số: Quỹ Tri thức Mohammed bin Rashid Al Maktoum vận hành, lưu trữ hơn 800.000 đầu sách, 8,5 triệu tài nguyên số từ 18+ thư viện, chuẩn hóa dữ liệu để mở rộng truy cập toàn cầu.

  • Từ điển AI của Trung tâm Ngôn ngữ Ả Rập Abu Dhabi: từ điển Ả Rập–Anh đầu tiên dùng AI, chứa 7.000+ thuật ngữ hiện đại, phát âm tự động, định nghĩa đơn giản, công cụ ngôn ngữ học tính toán.

  • BAREC (Balanced Arabic Readability Corpus): bộ ngữ liệu 10 triệu từ để đánh giá độ dễ đọc, hỗ trợ học tiếng Ả Rập, chú giải về chính tả, ngữ pháp, từ vựng, mã nguồn mở cho cộng đồng nghiên cứu.

  • Falcon Arabic: mô hình AI ngôn ngữ bản địa do TII phát triển, huấn luyện trên dữ liệu tiếng Ả Rập chuẩn và phương ngữ, tối ưu hiệu suất, phát triển hoàn toàn tại UAE. Phiên bản nhỏ gọn Falcon H1 vượt hiệu năng so với các mô hình cùng kích thước của Meta và Alibaba.

  • Ứng dụng AI trong xuất bản: khu “Digital square” tại Hội sách quốc tế Abu Dhabi, trình diễn ứng dụng AI trong số hóa và đổi mới sách, giáo trình, tài liệu học tập.

  • AI trong lớp học: tích hợp công cụ AI vào giảng dạy tiếng Ả Rập, kết hợp bảo tồn truyền thống và năng lực số.

  • Hợp tác quốc tế: thỏa thuận AI ký trong chuyến thăm của Tổng thống Mỹ Donald Trump, cho phép UAE tiếp cận chip AI Mỹ tiên tiến, tăng năng lực phát triển AI nội địa.

📌 UAE đang dùng AI để tạo kho ngôn ngữ tiếng Ả Rập lớn nhất thế giới, với 20 triệu từ, 800.000 sách, mô hình Falcon Arabic và bộ dữ liệu BAREC. Chiến lược này kết hợp bảo tồn di sản với phát triển công nghệ, đưa tiếng Ả Rập lên vị thế mạnh mẽ trong kỷ nguyên số.

https://timesofindia.indiatimes.com/world/middle-east/how-the-uae-is-using-artificial-intelligence-to-build-the-worlds-largest-arabic-language-resources/articleshow/123237801.cms

Không có file đính kèm.

63

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo