Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MHTS: Multi-Hop Tree Structure Framework for Generating Difficulty-Controllable QA Datasets for RAG Evaluation

Created by
  • Haebom

저자

Jeongsoo Lee, Daeyong Kwon, Kyohoon Jin, Junnyeong Jeong, Minwoo Sim, Minwoo Kim

개요

기존 RAG 벤치마크는 질문의 난이도를 간과하여 간단한 질문에 대한 성능이 과대평가되고 평가의 신뢰성이 떨어지는 문제가 있다. 본 논문에서는 품질, 다양성, 난이도라는 세 가지 주요 기준을 충족하는 견고한 벤치마크 데이터셋을 제시하기 위해, 다중 홉 트리 구조(MHTS)라는 새로운 데이터셋 합성 프레임워크를 제안한다. MHTS는 다중 홉 트리 구조를 활용하여 논리적으로 연결된 다중 청크 질문을 생성함으로써 다중 홉 추론의 복잡성을 체계적으로 제어한다. 또한, 제안하는 세밀한 난이도 추정 공식은 RAG 시스템의 전반적인 성능 지표와 강한 상관관계를 보여, 검색 및 답변 생성 능력을 평가하는 데 효과적임을 검증한다. 따라서 품질이 높고 다양하며 난이도가 제어된 질문을 보장함으로써 RAG 평가 및 벤치마킹 기능을 향상시킨다.

시사점, 한계점

시사점:
RAG 시스템 평가의 신뢰성을 높이는 새로운 벤치마크 데이터셋(MHTS) 제시
다중 홉 추론의 복잡성을 체계적으로 제어하는 방법 제시
질문의 난이도를 정확하게 측정하는 세밀한 난이도 추정 공식 제시
검색 및 답변 생성 능력을 종합적으로 평가 가능
RAG 평가 및 벤치마킹 기능 향상
한계점:
MHTS 데이터셋의 규모 및 다양성에 대한 구체적인 언급 부족
제안된 난이도 추정 공식의 일반화 가능성에 대한 추가 연구 필요
실제 RAG 시스템의 다양한 아키텍처 및 전략에 대한 적용성 검증 필요
👍