Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Vấn đề đã được giải quyết? Không gian thiết kế trích xuất thông tin cho các tài liệu có bố cục phong phú sử dụng LLM

Created by
  • Haebom

Tác giả

Gaye Colakoglu, Gurkan Solmaz, Jonathan Furst

Phác thảo

Bài báo này định nghĩa và khám phá một không gian thiết kế để trích xuất thông tin (IE) từ các tài liệu giàu bố cục bằng cách sử dụng mô hình ngôn ngữ quy mô lớn (LLM). Ba thách thức cốt lõi của IE nhận biết bố cục sử dụng LLM là cấu trúc dữ liệu, tương tác mô hình và cải thiện đầu ra. Chúng tôi nghiên cứu các bài toán con và phương pháp biểu diễn đầu vào, phân đoạn, nhắc nhở, lựa chọn LLM và các mô hình đa phương thức. Sử dụng LayIE-LLM, một bộ kiểm thử IE nhận biết bố cục mã nguồn mở mới, chúng tôi đánh giá hiệu quả của các lựa chọn thiết kế khác nhau so với các mô hình IE tinh chỉnh hiện có. Kết quả trên hai tập dữ liệu IE chứng minh rằng LLM yêu cầu điều chỉnh đường ống IE để đạt được hiệu suất cạnh tranh. Các cấu hình được tối ưu hóa tìm thấy với LayIE-LLM vượt trội hơn các cấu hình cơ sở chung sử dụng cùng LLM lần lượt là 13,3 và 37,5 điểm F1. Chúng tôi phát triển một phương pháp không đồng bộ một yếu tố (OFAT) tiếp cận kết quả tối ưu, chỉ cần một phần nhỏ (2,8%) nỗ lực tính toán và chỉ kém hiệu suất tìm kiếm giai thừa đầy đủ tốt nhất lần lượt là 0,8 và 1,8 điểm. Nhìn chung, chúng tôi chứng minh rằng một LLM đa năng được cấu hình đúng cách có thể sánh ngang với hiệu suất của các mô hình chuyên biệt và cung cấp một giải pháp thay thế tiết kiệm chi phí, không cần tinh chỉnh. Bộ thử nghiệm có sẵn tại https://github.com/gayecolakoglu/LayIE-LLM .

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp hiệu quả để trích xuất thông tin từ các tài liệu có bố cục phong phú: LLM có thể đạt được hiệu suất tương tự hoặc tốt hơn so với các mô hình tinh chỉnh hiện có.
Cung cấp giải pháp thay thế tiết kiệm chi phí: Trích xuất thông tin bằng LLM đa năng mà không cần tinh chỉnh.
Bộ kiểm thử nguồn mở LayIE-LLM đã được phát hành: Góp phần so sánh hiệu suất và nghiên cứu nhiều LLM và phương pháp luận khác nhau.
Trình bày phương pháp tìm kiếm tham số hiệu quả (OFAT): Tiếp cận hiệu suất tối ưu trong khi giảm độ phức tạp tính toán.
Limitations:
Hạn chế của các tập dữ liệu được sử dụng: Thiếu sự xác thực về khả năng khái quát hóa khi chỉ sử dụng hai tập dữ liệu.
ĐảM bảo tính tối ưu của phương pháp OFAT _____T116096____-: Có sự suy giảm hiệu suất nhẹ so với tìm kiếm giai thừa đầy đủ.
Phụ thuộc vào hiệu suất LLM: Kết quả có thể thay đổi khi hiệu suất LLM được cải thiện.
👍