Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

FinSage: Hệ thống RAG đa năng cho việc nộp hồ sơ tài chính - Trả lời câu hỏi

Created by
  • Haebom

Tác giả

Xinyu Wang, Jijun Chi, Zhenghan Tai, Tung Sum Thomas Kwok, Muzhi Li, Zhuhong Li, Hailin He, Yuchen Hua, Peng Lu, Suyuchen Wang, Yihong Wu, Jerry Huang, Jingrui Tian, Fengran Mo, Yufei Cui, Ling Chu

Phác thảo

Bài báo này đề cập đến những thách thức thực tế của việc tận dụng các hệ thống Tạo dữ liệu tăng cường truy xuất (RAG) trong lĩnh vực tài chính để giải quyết các yêu cầu tuân thủ phức tạp trong quy trình xử lý tài liệu tài chính. Các giải pháp hiện tại gặp khó khăn trong việc trích xuất thông tin quan trọng do tính không đồng nhất của dữ liệu (ví dụ: văn bản, bảng biểu, sơ đồ) và bản chất luôn thay đổi của các tiêu chuẩn quy định. Do đó, trong bài báo này, chúng tôi đề xuất FinSage, một khuôn khổ RAG đa phương thức để phân tích tuân thủ của các tài liệu tài chính đa dạng. FinSage bao gồm ba thành phần sáng tạo: một quy trình tiền xử lý đa phương thức tích hợp các định dạng dữ liệu đa dạng và tạo ra các bản tóm tắt siêu dữ liệu ở cấp độ khối; một hệ thống tìm kiếm thưa-dày đa đường dẫn với tính năng mở rộng truy vấn (HyDE) và tìm kiếm ngữ nghĩa có nhận biết siêu dữ liệu; và một mô-đun xếp hạng lại theo miền cụ thể được tinh chỉnh thông qua Tối ưu hóa tùy chọn trực tiếp (DPO) để ưu tiên nội dung quan trọng về tuân thủ. Kết quả thử nghiệm cho thấy FinSage đạt tỷ lệ thu hồi ấn tượng 92,51% trên 75 câu hỏi do chuyên gia lựa chọn, cải thiện độ chính xác 24,06% so với phương pháp hiệu suất cao nhất trước đó trên tập dữ liệu trả lời câu hỏi FinanceBench. Hơn nữa, FinSage đã được triển khai thành công như một đại lý trả lời câu hỏi tài chính trong một hội nghị trực tuyến, phục vụ hơn 1.200 người tham dự.

Takeaways, Limitations

Takeaways:
Chúng tôi giới thiệu FinSage, một khuôn khổ RAG hiệu quả để xử lý nhiều loại dữ liệu tài chính khác nhau và để phân tích tuân thủ quy định.
Đã Chứng minh hiệu suất vượt trội khi đạt được độ chính xác được cải thiện 24,06% so với các phương pháp hiện có trên tập dữ liệu FinanceBench.
Phục vụ hơn 1.200 người trong môi trường họp trực tuyến thực tế, chứng minh tính thực tiễn của nó.
Các thành phần cải tiến như xử lý trước đa chế độ, tìm kiếm đa đường dẫn và mô-đun xếp hạng lại dựa trên DPO được trình bày.
Limitations:
Thiếu đánh giá hiệu suất trên các tập dữ liệu khác ngoài tập dữ liệu FinanceBench.
Cần nghiên cứu thêm để xác định khả năng thích ứng của FinSage với những thay đổi liên tục về tiêu chuẩn quản lý.
Thiếu phân tích về khả năng mở rộng và chi phí bảo trì của FinSage.
Chuyên sâu vào một lĩnh vực tài chính cụ thể, cần nghiên cứu thêm để xác định khả năng tổng quát hóa cho các lĩnh vực khác.
👍