Sign In

SuperRAG: Beyond RAG with Layout-Aware Graph Modeling

Created by
  • Haebom
Category
Empty

저자

Jeff Yang, Duy-Khanh Vu, Minh-Tien Nguyen, Xuan-Quang Nguyen, Linh Nguyen, Hung Le

개요

본 논문은 다중 모드 RAG(Retrieval Augmented Generation)를 위한 레이아웃 인식 그래프 모델링을 제시한다. 기존의 RAG 방법들이 주로 평면 텍스트 청크를 다루는 것과 달리, 제안된 방법은 그래프 구조를 사용하여 다중 모드 간의 관계를 고려한다. 이를 위해 문서 레이아웃 파싱을 기반으로 그래프 모델링 구조를 정의한다. 입력 문서의 구조는 텍스트 청크, 표, 그림의 연결과 함께 유지된다. 이러한 표현은 다중 모드의 정보를 필요로 하는 복잡한 질문을 처리할 수 있도록 한다. 그래프 모델링의 효율성을 확인하기 위해 강력한 구성 요소를 사용한 유연한 RAG 파이프라인을 개발하였다. 네 개의 벤치마크 테스트 세트에 대한 실험 결과는 RAG 파이프라인의 성능 향상을 위한 레이아웃 인식 모델링의 기여를 확인한다.

시사점, 한계점

시사점:
다중 모드 정보를 효과적으로 활용하여 복잡한 질문에 대한 응답 정확도를 향상시킬 수 있음을 보여줌.
문서 레이아웃 정보를 활용한 그래프 모델링이 RAG 성능 향상에 기여함을 실험적으로 증명.
유연한 RAG 파이프라인 구축을 위한 효과적인 방법론 제시.
한계점:
제안된 방법의 성능 향상이 특정 벤치마크 데이터셋에 국한될 가능성 존재.
다양한 유형의 문서 레이아웃에 대한 일반화 성능 검증 필요.
레이아웃 파싱의 정확도가 전체 시스템 성능에 영향을 미칠 수 있음.
매우 복잡하거나 비정형적인 레이아웃을 가진 문서에 대한 처리 성능 평가 필요.
👍