- OneGen là một khung AI mới được phát triển bởi các nhà nghiên cứu từ Đại học Chiết Giang, cho phép mô hình ngôn ngữ lớn (LLM) thực hiện đồng thời cả hai nhiệm vụ truy xuất và tạo sinh thông tin.
- Thách thức lớn trong việc triển khai LLM hiện nay là khả năng xử lý kém các tác vụ yêu cầu cả việc truy xuất và tạo sinh, dẫn đến tăng độ phức tạp tính toán và thời gian suy diễn.
- Các phương pháp trước đây như Retrieval-Augmented Generation (RAG) đã cố gắng tích hợp truy xuất vào quy trình tạo sinh, nhưng vẫn yêu cầu các mô hình riêng biệt cho từng nhiệm vụ, gây tốn kém tài nguyên.
- OneGen giải quyết vấn đề này bằng cách kết hợp các token truy xuất tự động vào mô hình, cho phép thực hiện cả hai nhiệm vụ trong một lần truyền qua duy nhất, giảm thiểu thời gian và chi phí tính toán.
- Mô hình sử dụng các token truy xuất được tạo ra trong quá trình autoregressive, cho phép truy xuất tài liệu mà không cần mô hình truy xuất riêng biệt.
- OneGen đã được đánh giá trên nhiều tập dữ liệu, bao gồm HotpotQA và TriviaQA cho các tác vụ hỏi đáp, cũng như các tập dữ liệu dựa trên Wikipedia cho việc liên kết thực thể.
- Kết quả cho thấy OneGen cải thiện độ chính xác và điểm F1 so với các mô hình hiện có như Self-RAG và GRIT, với cải thiện 3.2 điểm trong độ chính xác trên sáu tập dữ liệu liên kết thực thể.
- Mô hình duy trì hiệu suất tốt trong các tác vụ truy xuất trong khi nâng cao khả năng tạo sinh, cho thấy khả năng xử lý nhanh chóng và chính xác hơn mà không làm giảm chất lượng.
- OneGen có tiềm năng cách mạng hóa cách mà LLM xử lý các tác vụ phức tạp, làm cho chúng phù hợp hơn với các ứng dụng thực tế yêu cầu tốc độ và độ chính xác cao.
📌 OneGen là một khung AI tiên tiến cho phép mô hình ngôn ngữ lớn xử lý đồng thời truy xuất và tạo sinh, cải thiện độ chính xác lên đến 3.3 điểm F1 trong các tác vụ phức tạp, mở ra cơ hội mới cho ứng dụng thực tế hiệu quả hơn.
https://www.marktechpost.com/2024/09/14/onegen-an-ai-framework-that-enables-a-single-llm-to-handle-both-retrieval-and-generation-simultaneously/