MAG-SQL: Độ chính xác 61% trên bộ dữ liệu BIRD, vượt trội chuyển đổi văn bản sang SQL

SEO contents:

• MAG-SQL là một phương pháp đa tác tử tạo sinh mới được phát triển bởi các nhà nghiên cứu từ Đại học Công nghệ Nam Trung Quốc và Đại học Thanh Hoa nhằm cải thiện quá trình chuyển đổi văn bản sang SQL.

• Chuyển đổi văn bản sang SQL là một lĩnh vực quan trọng trong xử lý ngôn ngữ tự nhiên, cho phép người dùng truy vấn cơ sở dữ liệu bằng ngôn ngữ thông thường thay vì các lệnh SQL kỹ thuật.

• Thách thức chính trong lĩnh vực này là sự phức tạp của cơ sở dữ liệu và tính đa dạng của các truy vấn người dùng, đặc biệt là với các bộ dữ liệu khó như BIRD.

• Các phương pháp hiện có như học trong ngữ cảnh (ICL) và học có giám sát thường yêu cầu tinh chỉnh mở rộng và lấy mẫu quy mô lớn từ các mô hình ngôn ngữ.

• MAG-SQL bao gồm 4 thành phần chính: Soft Schema Linker, Targets-Conditions Decomposer, Sub-SQL Generator và Sub-SQL Refiner.

• Soft Schema Linker lọc lược đồ cơ sở dữ liệu để chọn các cột liên quan nhất cho việc tạo SQL.

• Targets-Conditions Decomposer chia nhỏ các truy vấn phức tạp thành các truy vấn con dễ quản lý hơn.

• Sub-SQL Generator tạo ra các truy vấn con SQL dựa trên các truy vấn trước đó.

• Sub-SQL Refiner sửa chữa các lỗi trong các truy vấn SQL được tạo ra.

Khi sử dụng GPT-4, MAG-SQL đạt độ chính xác thực thi 61,08% trên bộ dữ liệu BIRD, vượt trội so với độ chính xác cơ sở 46,35% của GPT-4 thông thường.

• Ngay cả khi sử dụng GPT-3.5, MAG-SQL vẫn vượt trội so với phương pháp MAC-SQL với độ chính xác 57,62%.

• Trên bộ dữ liệu Spider, MAG-SQL cải thiện 11,9% so với độ chính xác cơ sở zero-shot của GPT-4.

MAG-SQL giải quyết các thách thức quan trọng trong việc chuyển đổi ngôn ngữ tự nhiên thành lệnh SQL, đặc biệt là trong các kịch bản phức tạp liên quan đến cơ sở dữ liệu quy mô lớn và các truy vấn phức tạp.

• Phương pháp này không chỉ cải thiện hiệu suất trên các điểm chuẩn khó như BIRD và Spider mà còn cho thấy tiềm năng của hệ thống đa tác tử trong việc nâng cao khả năng của các mô hình ngôn ngữ lớn.

📌 MAG-SQL đạt độ chính xác 61,08% trên bộ dữ liệu BIRD khi sử dụng GPT-4, vượt trội so với các phương pháp hiện có. Phương pháp đa tác tử này cải thiện đáng kể quá trình chuyển đổi văn bản sang SQL, đặc biệt với cơ sở dữ liệu phức tạp, mở ra tiềm năng ứng dụng rộng rãi trong thực tế.

https://www.marktechpost.com/2024/08/19/mag-sql-a-multi-agent-generative-approach-achieving-61-accuracy-on-bird-dataset-using-gpt-4-for-enhanced-text-to-sql-query-refinement/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo