# Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering

### 저자

Changjian Wang, Weihong Deng, Weili Guan, Quan Lu, Ning Jiang

### 개요

본 논문은 다단계 질의응답(MHQA)을 위한 새로운 RAG(Retrieval-Augmented Generation) 접근 방식인 HGRAG를 제안합니다. 기존 RAG 방법들은 다양한 구절에 산재된 지식을 통합하는 데 어려움을 겪는데, 이는 구조적 연관성을 무시하고 조잡한 문자 의미론적 유사성에만 초점을 맞추기 때문입니다.  HGRAG는 초그래프를 통해 구조적 및 의미론적 정보를 교차적으로 통합합니다.  세부적으로는, 엔티티를 노드로, 구절을 하이퍼에지로 하는 엔티티 초그래프를 구성하고, 공유 엔티티를 통해 지식 연관성을 확립합니다. 또한, 하이퍼그래프 확산을 통해 세부 엔티티 유사성과 조잡한 구절 유사성을 통합하는 하이퍼그래프 검색 방법을 설계합니다.  마지막으로, 검색 결과를 의미론적 및 구조적으로 개선하는 검색 개선 모듈을 사용하여 답변 생성에 가장 관련성이 높은 구절을 컨텍스트로 얻습니다.  벤치마크 데이터셋에 대한 실험 결과는 HGRAG가 최첨단 방법보다 성능이 우수하며 검색 효율성이 6배 향상됨을 보여줍니다.

### 시사점, 한계점

- **시사점:**

    - 다단계 질의응답(MHQA) 문제에 대한 새로운 접근 방식 제시: 초그래프를 이용하여 구조적 및 의미론적 정보를 효과적으로 통합.

    - 기존 RAG 방식의 한계점 극복:  구조 정보 과의존 및 세부 정보 과집중 문제 해결.

    - 향상된 성능 및 효율성: 최첨단 방법보다 우수한 QA 성능과 6배 향상된 검색 효율 달성.

- **한계점:**

    - 제안된 방법의 일반화 성능에 대한 추가적인 검증 필요: 다양한 데이터셋 및 질문 유형에 대한 실험 결과 추가.

    - 초그래프 구축 및 검색 과정의 복잡성:  대규모 데이터셋에 대한 적용 가능성 및 확장성 평가 필요.

    - LLM을 사용한 답변 생성 과정의 해석성 부족:  결정 과정에 대한 투명성 확보 방안 모색 필요.

[PDF 보기](https://arxiv.org/pdf/2508.11247)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
