- XMainframe là mô hình ngôn ngữ lớn (LLM) được phát triển bởi Trung tâm AI của FPT Software, chuyên về hiện đại hóa hệ thống mainframe và mã COBOL.
- Hệ thống mainframe, ra đời từ những năm 1940, vẫn rất quan trọng trong các lĩnh vực tài chính và chính phủ, nhưng mã COBOL hiện tại cần được chuyển đổi sang nền tảng hiện đại.
- Ước tính có khoảng 200 đến 220 tỷ dòng mã COBOL cần được di chuyển, với chi phí viết lại dao động từ 32 đến 50 cent mỗi dòng, tổng chi phí lên tới 100 tỷ USD.
- Việc viết lại mã COBOL hoàn toàn bằng tay vẫn chưa có thời gian xác định, tạo ra một thách thức lớn cho ngành công nghiệp.
- Các mô hình ngôn ngữ lớn hiện tại thiếu đào tạo đầy đủ về các ngôn ngữ mainframe, dẫn đến khả năng hiểu và lý luận kém về mã COBOL.
- Các tổ chức thường giữ bí mật mã nguồn mainframe do yêu cầu bảo mật cao, khiến dữ liệu đào tạo trở nên hạn chế.
- Thiếu tài liệu tổng thể và mục tiêu kinh doanh rõ ràng cho các hệ thống mainframe gây khó khăn trong việc phát triển tiêu chuẩn đánh giá chất lượng cho LLM.
- XMainframe đã phát triển một quy trình thu thập dữ liệu rộng lớn để tạo ra các bộ dữ liệu đào tạo chất lượng cao, nâng cao hiệu suất trong lĩnh vực này.
- MainframeBench là một tiêu chuẩn đánh giá mới cho kiến thức về mainframe, bao gồm các câu hỏi trắc nghiệm, trả lời câu hỏi và tóm tắt mã COBOL.
- XMainframe đã chứng minh hiệu suất vượt trội so với các LLM hiện có, đạt độ chính xác cao hơn 30% so với DeepSeek-Coder trong các câu hỏi trắc nghiệm.
- Điểm BLEU của XMainframe trong việc trả lời câu hỏi gấp đôi so với Mixtral-Instruct 8x7B và đạt điểm cao gấp sáu lần so với GPT-3.5 trong tóm tắt COBOL.
- Nghiên cứu này cho thấy tiềm năng của XMainframe trong việc quản lý và hiện đại hóa các hệ thống kế thừa, từ đó nâng cao năng suất và tiết kiệm thời gian cho các nhà phát triển phần mềm.
📌 XMainframe là mô hình ngôn ngữ lớn tiên tiến, giúp hiện đại hóa mã nguồn kế thừa trị giá 100 tỷ USD, vượt trội hơn 30% so với các mô hình hiện tại trong các bài kiểm tra kiến thức về mainframe.
Citations:
[1] https://arxiv.org/abs/2408.046
https://www.marktechpost.com/2024/08/12/researchers-at-fpt-software-ai-center-introduce-xmainframe-a-state-of-the-art-large-language-model-llm-specialized-for-mainframe-modernization-to-address-the-100b-legacy-code-modernization/