- Nghiên cứu của MIT cho thấy mô hình ngôn ngữ lớn (LLM) có khả năng phát hiện bất thường trong dữ liệu chuỗi thời gian mà không cần quá trình đào tạo tốn kém.
- Việc phát hiện một tuabin hỏng trong trang trại gió yêu cầu phân tích hàng triệu điểm dữ liệu và hàng trăm tín hiệu, một nhiệm vụ phức tạp.
- Các kỹ sư thường sử dụng mô hình học sâu để phát hiện bất thường, nhưng việc đào tạo mô hình này rất tốn kém và phức tạp.
- MIT phát triển một framework gọi là SigLLM, có khả năng chuyển đổi dữ liệu chuỗi thời gian thành đầu vào dạng văn bản mà LLM có thể xử lý.
- Người dùng có thể cung cấp dữ liệu đã chuẩn bị cho mô hình và yêu cầu nó phát hiện bất thường hoặc dự đoán các điểm dữ liệu trong tương lai.
- Mặc dù LLM không vượt trội hơn các mô hình học sâu hiện tại, nhưng chúng có thể hoạt động hiệu quả trong một số trường hợp.
- Khung SigLLM có hai phương pháp phát hiện bất thường: Prompter và Detector.
- Phương pháp Prompter yêu cầu LLM xác định giá trị bất thường từ dữ liệu đã chuẩn bị, trong khi Detector dự đoán giá trị tiếp theo và so sánh với giá trị thực tế.
- Phương pháp Detector đã chứng minh hiệu quả hơn so với Prompter, với ít trường hợp dương tính giả hơn.
- Nghiên cứu cho thấy LLM có thể là một lựa chọn khả thi cho việc phát hiện bất thường trong các hệ thống như máy móc nặng hoặc vệ tinh.
- Mặc dù LLM có tiềm năng, nhưng các mô hình học sâu hiện tại vẫn vượt trội hơn nhiều.
- Các nhà nghiên cứu đang tìm cách cải thiện hiệu suất của LLM và giảm thời gian xử lý từ 30 phút đến 2 giờ.
- Họ cũng hy vọng LLM có thể cung cấp giải thích bằng ngôn ngữ đơn giản cho các dự đoán của mình trong tương lai.
📌 Nghiên cứu của MIT về việc sử dụng mô hình ngôn ngữ lớn để phát hiện bất thường trong dữ liệu chuỗi thời gian cho thấy tiềm năng lớn trong việc giám sát hệ thống phức tạp mà không cần đào tạo tốn kém. Phương pháp Detector đã vượt qua nhiều mô hình AI hiện tại trong một số trường hợp.
https://news.mit.edu/2024/researchers-use-large-language-models-to-flag-problems-0814
#MIT