- Naver giới thiệu dòng mô hình ngôn ngữ lớn HyperCLOVA X có khả năng lập luận đa ngôn ngữ tốt hơn các mô hình khác, đặc biệt với các ngôn ngữ châu Á.
- HyperCLOVA X được tiền huấn luyện trên dữ liệu tiếng Hàn, đa ngôn ngữ và mã nguồn, trong đó 1/3 là tiếng Hàn. Quá trình huấn luyện tính đến ngữ pháp đặc thù của tiếng Hàn.
- Kết quả là các mô hình thành thạo cả tiếng Hàn và tiếng Anh, đồng thời thể hiện khả năng đa ngôn ngữ, có thể mở rộng sang các ngôn ngữ khác ngoài ngôn ngữ huấn luyện.
- HyperCLOVA X đạt trình độ state-of-the-art trong dịch máy giữa tiếng Hàn và các ngôn ngữ ít xuất hiện trong dữ liệu huấn luyện như tiếng Nhật, Trung.
- Mô hình cũng thể hiện khả năng chuyển giao chéo ngôn ngữ giữa tiếng Hàn và Anh, khi tinh chỉnh hướng dẫn bằng một ngôn ngữ sẽ dẫn đến khả năng tuân theo hướng dẫn bằng ngôn ngữ kia.
- Kết quả kiểm tra đa ngôn ngữ cho thấy HyperCLOVA X có thể chuyển sang các ngôn ngữ châu Á ít xuất hiện trong dữ liệu tiền huấn luyện.
- AI có chủ quyền đang nổi lên như một năng lực quốc gia cần thiết để đảm bảo an ninh dữ liệu và giảm sự phụ thuộc vào các nhà cung cấp nước ngoài.
- Các mô hình ngôn ngữ lớn chính thống hiện tại có hạn chế trong xử lý và hiểu các ngôn ngữ không phải tiếng Anh như tiếng Hàn do sự chi phối quá mức của tiếng Anh và văn hóa Bắc Mỹ trong kho ngữ liệu tiền huấn luyện.
📌 HyperCLOVA X của Naver thể hiện khả năng lập luận đa ngôn ngữ vượt trội, đặc biệt với các ngôn ngữ châu Á, mở ra tiềm năng phát triển các mô hình ngôn ngữ lớn có chủ quyền cho khu vực. Trong tương lai, Naver sẽ tạo ra AI siêu quy mô chuyên biệt cho nhiều khu vực, quốc gia, đồng thời nghiên cứu tích hợp công cụ, API bên ngoài để mở rộng chức năng mô hình.
https://www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/