HyperCLOVA X: Mô hình ngôn ngữ đa ngôn ngữ của NAVER Cloud cho tiếng Hàn và văn hóa Hàn Quốc

- Các nhà nghiên cứu từ NAVER Cloud giới thiệu HyperCLOVA X, tập trung vào tiếng Hàn và văn hóa Hàn Quốc trong khi duy trì thành thạo tiếng Anh và lập trình.
- Sự đổi mới nằm ở sự cân bằng dữ liệu tiếng Hàn, tiếng Anh và mã lập trình, được tinh chỉnh thông qua hướng dẫn trên các bộ dữ liệu chú thích bởi con người chất lượng cao dưới các nguyên tắc an toàn nghiêm ngặt.
- Phương pháp của HyperCLOVA X tích hợp các cải tiến kiến trúc transformer, cụ thể là nhúng vị trí quay và tập trung vào truy vấn theo nhóm, để mở rộng hiểu biết ngữ cảnh và sự ổn định đào tạo. 
- Mô hình trải qua Tinh chỉnh có giám sát (SFT) sử dụng các bộ dữ liệu minh họa được chú thích bởi con người, tiếp theo là Học tăng cường từ phản hồi của con người (RLHF) để sắp xếp đầu ra phù hợp với các giá trị của con người.
- HyperCLOVA X đạt độ chính xác 72,07% trong các điểm chuẩn tiếng Hàn toàn diện, vượt qua các tiền nhiệm và thiết lập tiêu chuẩn mới cho việc hiểu ngôn ngữ tiếng Hàn. Nó đạt tỷ lệ chính xác 58,25% trong các tác vụ lập luận tiếng Anh.
- HyperCLOVA X thể hiện tính linh hoạt trong các thử thách lập trình bằng cách đạt tỷ lệ thành công 56,83%, thể hiện sự thành thạo trong các tác vụ ngôn ngữ và đánh giá lập trình kỹ thuật.

📌 HyperCLOVA X của NAVER Cloud đạt được hiểu biết ngôn ngữ và điểm chuẩn lập trình đáng kể với độ chính xác 72,07% cho tiếng Hàn, 58,25% cho tiếng Anh và tỷ lệ thành công 56,83% trong lập trình. Mô hình tích hợp kiến trúc transformer tiên tiến và học liệu, đồng thời chú trọng đến an toàn và đạo đức, thúc đẩy đáng kể khả năng thích ứng ngôn ngữ và văn hóa của AI.

https://www.marktechpost.com/2024/04/06/naver-cloud-researchers-introduce-hyperclova-x-a-multilingual-language-model-tailored-to-korean-language-and-culture/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo