• Nghiên cứu mô hình ngôn ngữ lớn (LLM) đã phát triển nhanh chóng, tập trung vào việc cải thiện khả năng hiểu và xử lý ngôn ngữ, đặc biệt trong các lĩnh vực chuyên môn như tài chính.
• LLM đã vượt qua các tác vụ phân loại cơ bản để trở thành công cụ mạnh mẽ có khả năng truy xuất và tạo ra kiến thức phức tạp.
• Một thách thức lớn trong nghiên cứu LLM là cân bằng giữa hiệu quả chi phí và hiệu suất. LLM tốn kém về mặt tính toán và có nguy cơ tạo ra thông tin không chính xác khi xử lý bộ dữ liệu lớn hơn.
• Các phương pháp truyền thống dựa nhiều vào một mô hình transformer dày đặc duy nhất, thường gặp vấn đề về ảo giác, tạo ra thông tin không chính xác hoặc không liên quan.
• Các nhà nghiên cứu đã khám phá nhiều phương pháp để giải quyết những thách thức này, bao gồm mô hình tổng hợp, nhưng chúng tốn kém và chậm xử lý.
• Nhóm nghiên cứu từ Vanguard IMFS đã giới thiệu khung công tác mới có tên Mixture of Agents (MoA) để khắc phục những hạn chế của phương pháp tổng hợp truyền thống.
• MoA là một hệ thống đa tác tử tiên tiến được thiết kế đặc biệt cho các tác vụ tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG).
• MoA sử dụng tập hợp các mô hình nhỏ chuyên biệt làm việc cùng nhau một cách phối hợp cao độ để trả lời các câu hỏi phức tạp với độ chính xác cao hơn và chi phí thấp hơn.
• Hệ thống MoA bao gồm nhiều tác tử chuyên biệt, mỗi tác tử đóng vai trò như một "nhà nghiên cứu cấp dưới" với trọng tâm cụ thể như phân tích tình cảm, số liệu tài chính hoặc tính toán toán học.
• Trong các bài kiểm tra, hệ thống MoA có thể phân tích hàng chục nghìn tài liệu tài chính trong vòng chưa đầy 60 giây bằng cách sử dụng hai lớp tác tử.
• Một hệ thống MoA cơ bản với hai tác tử Mistral-7B đã được thử nghiệm cùng với các hệ thống mô hình đơn như GPT-4 và Claude 3 Opus. Hệ thống MoA liên tục cung cấp câu trả lời chính xác và toàn diện hơn.
• Tính hiệu quả về chi phí của MoA khiến nó rất phù hợp cho các ứng dụng tài chính quy mô lớn. Nhóm IMFS của Vanguard báo cáo rằng hệ thống MoA của họ hoạt động với tổng chi phí hàng tháng dưới 8.000 USD trong khi xử lý các truy vấn từ một nhóm nhà nghiên cứu.
• Thiết kế mô-đun của khung công tác MoA cho phép các công ty mở rộng hoạt động dựa trên ngân sách và nhu cầu, với khả năng linh hoạt thêm hoặc bớt tác tử khi cần thiết.
📌 Khung công tác Mixture of Agents (MoA) từ Vanguard IMFS cung cấp giải pháp mạnh mẽ để cải thiện hiệu suất của mô hình ngôn ngữ lớn trong tài chính. MoA xử lý 10.000 tài liệu trong 60 giây, chính xác hơn GPT-4 và Claude, với chi phí dưới 8.000 USD/tháng, hứa hẹn trở thành tiêu chuẩn cho ứng dụng cấp doanh nghiệp.
https://www.marktechpost.com/2024/09/17/collaborative-small-language-models-for-finance-meet-the-mixture-of-agents-moa-framework-from-vanguard-imfs/