Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering

Created by
  • Haebom

저자

Huiyao Chen, Yi Yang, Yinghui Li, Meishan Zhang, Min Zhang

Long Document Question Answering with Discourse Structure

개요

본 논문은 인간의 이해 방식을 돕는 담론 구조를 포착하지 못하는 기존의 긴 문서 질의응답 시스템의 한계를 해결하고자, 수사 구조 이론(RST)을 활용한 담론 인식 계층적 프레임워크를 제시한다. 이 프레임워크는 담론 트리를 문장 수준 표현으로 변환하고, LLM 기반 노드 표현을 사용하여 구조적 및 의미적 정보를 연결한다. 핵심 혁신은 긴 문서를 위한 특화된 담론 파싱, LLM 기반 담론 관계 노드 강화, 구조 기반 계층적 검색이다. QASPER, QuALITY, NarrativeQA에 대한 실험을 통해 기존 접근 방식 대비 일관된 성능 향상을 보였으며, 담론 구조 통합이 다양한 문서 유형에서 질의응답 성능을 유의미하게 향상시킨다는 것을 확인했다.

시사점, 한계점

시사점:
RST를 활용한 담론 구조를 통해 긴 문서 질의응답 성능을 향상시킴.
LLM을 활용하여 구조적, 의미적 정보를 연결하는 혁신적인 접근 방식 제시.
QASPER, QuALITY, NarrativeQA 데이터셋에서 기존 방법론 대비 우수한 성능 입증.
담론 구조 통합의 효과를 다양한 문서 유형에서 확인.
한계점:
논문 자체에서 언급된 한계점은 명시되지 않음. (논문에서 제시된 내용만으로 응답)
👍