• Nghiên cứu được thực hiện bởi các nhà khoa học từ Đại học Nantong, Đại học Kỹ thuật Munich và Đại học Công nghệ Hóa học Bắc Kinh, phân tích 29.057 bài đăng trên diễn đàn nhà phát triển OpenAI.
• Kể từ khi ra mắt ChatGPT và GPT-4, số lượng bài đăng về phát triển LLM tăng 292% và số lượng người dùng mới tăng 1.302%.
• Nghiên cứu xác định 27 thách thức phụ trong phát triển LLM, bao gồm sử dụng API, xử lý lỗi, tối ưu hóa hiệu suất, thiết kế prompt và tích hợp với ứng dụng tùy chỉnh.
• 8,7% vấn đề liên quan đến lỗi sử dụng API và 7,5% liên quan đến thông báo lỗi khi gọi API.
• Thiếu tài liệu hướng dẫn và hỗ trợ là một trong những thách thức lớn nhất đối với nhà phát triển.
• 54% câu hỏi trên diễn đàn có ít hơn 3 câu trả lời, cho thấy nhiều vấn đề vẫn chưa được giải quyết.
• Nghiên cứu đề xuất cải thiện hệ thống hỗ trợ và tài liệu từ các nhà cung cấp LLM như OpenAI.
• Phát triển LLM khác biệt so với phát triển phần mềm truyền thống, đòi hỏi cách tiếp cận mới.
• Quản lý API, cấu hình tham số và xử lý lỗi là những thách thức phổ biến.
• Đảm bảo quyền riêng tư và bảo mật dữ liệu, đặc biệt khi xử lý dữ liệu người dùng, tạo ra một lớp phức tạp khác.
• Nghiên cứu cung cấp một khuôn khổ nhất quán để cải thiện công cụ và tài liệu LLM trong tương lai.
• Kết quả nhấn mạnh nhu cầu hỗ trợ và tài nguyên tốt hơn để giúp nhà phát triển vượt qua các thách thức phức tạp trong phát triển LLM.
📌 Nghiên cứu phân tích 29.057 bài đăng, xác định 27 thách thức trong phát triển LLM. 54% vấn đề chưa được giải quyết, đòi hỏi cải thiện hỗ trợ. Số lượng bài đăng tăng 292% và người dùng mới tăng 1.302% kể từ khi ra mắt ChatGPT/GPT-4.
https://www.marktechpost.com/2024/08/18/understanding-the-27-unique-challenges-in-large-language-model-development-an-empirical-study-of-over-29000-developer-forum-posts-and-54-unresolved-issues/