Liệu chữ Hán có phải là chìa khóa bí mật đằng sau thành công của DeepSeek?

- DeepSeek, một công ty khởi nghiệp AI của Trung Quốc, đang thu hút sự chú ý toàn cầu với mô hình ngôn ngữ lớn nguồn mở có hiệu suất cao và tiết kiệm chi phí

- Các chuyên gia trong ngành cho rằng việc tích hợp chữ Hán trong giai đoạn tiền đào tạo là yếu tố quan trọng tạo nên thành công của mô hình

- Theo chuyên gia viễn thông Xiang Ligang, chữ Hán có khả năng truyền tải thông tin tối đa với chi phí tối thiểu

- Đặc tính đa phương thức của chữ Hán, kết hợp yếu tố hình ảnh với ý nghĩa, cung cấp nguồn tư liệu học tập phong phú cho các mô hình AI

- Mặc dù DeepSeek chưa công bố nguồn dữ liệu đào tạo, các chuyên gia phỏng đoán dữ liệu tiếng Trung bao gồm nhiều loại tài liệu:
  + Văn học cổ điển
  + Biệt ngữ internet
  + Bài báo học thuật
  + Tài liệu chính phủ
  + Phương ngữ 

- Sự đa dạng trong dữ liệu đào tạo tạo nền tảng ngôn ngữ toàn diện, góp phần nâng cao hiệu suất của mô hình

📌 DeepSeek đang chứng minh tiềm năng vượt trội của mô hình ngôn ngữ lớn nguồn mở dựa trên nền tảng chữ Hán. Đặc tính mật độ thông tin cao và tính đa phương thức của chữ Hán giúp tối ưu hóa hiệu suất và chi phí trong xử lý AI.

https://www.malaymail.com/news/tech-gadgets/2025/02/15/deepseeks-rise-is-the-chinese-language-the-secret-ingredient-to-its-ai-edge/166793

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo