본 논문에서는 기존 RAG(Retrieval Augmented Generation) 벤치마크의 한계점인 질의 난이도 고려 부족을 해결하기 위해, 다단계 추론 복잡성을 체계적으로 제어하는 새로운 데이터셋 합성 프레임워크인 MHTS (Multi-Hop Tree Structure)를 제안합니다. MHTS는 다단계 트리 구조를 활용하여 논리적으로 연결된 다중 청크 질의를 생성하며, 정교한 난이도 추정 공식을 통해 검색 및 답변 생성 능력을 효과적으로 평가합니다. 고품질, 다양성, 난이도 제어 질의를 보장함으로써 RAG 평가 및 벤치마킹 기능을 향상시킵니다.