Nghiên cứu AI của JPMorgan giới thiệu DocGraphLM

  • JPMorgan AI Research và Dartmouth College Hanover đã giới thiệu một khung công nghệ AI mới tên là DocGraphLM.
  • DocGraphLM kết hợp sức mạnh của các mô hình ngôn ngữ được huấn luyện sẵn và ngữ nghĩa đồ thị để cải thiện việc biểu diễn tài liệu trong việc trích xuất thông tin và QA.
  • Đặc điểm nổi bật của DocGraphLM là khả năng tích hợp cấu trúc của GNNs và sức mạnh của ngôn ngữ mô hình, cung cấp một biểu diễn tài liệu mạnh mẽ hơn.
  • Khung công nghệ này sử dụng một kiến trúc mã hóa chung cho biểu diễn tài liệu và một phương pháp tiên đoán liên kết mới để tái tạo đồ thị tài liệu.
  • Mô hình này có khả năng dự đoán hướng và khoảng cách giữa các nút trong đồ thị tài liệu, với một hàm mất mát chung mới giúp cân bằng giữa phân loại và mất mát hồi quy.
  • DocGraphLM áp dụng một biến đổi logarit để chuẩn hóa khoảng cách, xử lý các nút cách nhau bởi khoảng cách cấp số nhận được như là tương đương về ngữ nghĩa.
  • Mô hình đã cải thiện đáng kể việc trích xuất thông tin và nhiệm vụ trả lời câu hỏi khi được thử nghiệm trên các bộ dữ liệu chuẩn như FUNSD, CORD, và DocVQA.
  • Sự tích hợp của các đặc trưng đồ thị giúp tăng độ chính xác và tăng tốc quá trình học trong quá trình đào tạo.

📌 DocGraphLM từ JPMorgan AI Research đánh dấu một bước tiến quan trọng trong việc hiểu và biểu diễn tài liệu. DocGraphLM mở ra hướng mới trong việc biểu diễn và xử lý thông tin từ tài liệu phức tạp, với kết quả thử nghiệm ấn tượng trên các bộ dữ liệu chuẩn. Sự hợp nhất giữa ngữ nghĩa đồ thị và mô hình ngôn ngữ huấn luyện sẵn cho thấy tiềm năng lớn trong việc cải thiện các hệ thống trích xuất thông tin và trả lời câu hỏi tự động, hứa hẹn sự ứng dụng rộng rãi trong ngành công nghiệp và nghiên cứu AI.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo