본 논문은 Retrieval-Augmented Generation (RAG) 시스템의 성능 향상을 위한 새로운 색인 방식인 SiReRAG을 제안합니다. 기존 방법들이 의미적 유사성(similarity) 또는 관련 정보(relatedness) 중 하나의 관점만 고려하는 것과 달리, SiReRAG은 유사성과 관련성 정보를 모두 명시적으로 고려합니다. 유사성 측면에서는 기존 연구를 바탕으로 재귀적 요약을 이용한 유사성 트리를 구축하고, 관련성 측면에서는 문장에서 명제와 개체를 추출하여 공유된 개체를 통해 명제를 그룹화하고 재귀적 요약을 이용하여 관련성 트리를 구축합니다. 최종적으로 유사성 트리와 관련성 트리를 통합된 검색 풀로 색인 및 평탄화합니다. 실험 결과, SiReRAG은 세 가지 다단계 추론 데이터셋(MuSiQue, 2WikiMultiHopQA, HotpotQA)에서 최첨단 색인 방법들을 능가하며, F1 점수에서 평균 1.9% 향상을 보였습니다. 또한 기존 재순위 지정 방법들을 최대 7.8% 향상시키는 효율적인 솔루션임을 입증했습니다.