본 논문은 Retrieval-augmented generation (RAG) 시스템의 한계점인 중복성 문제와 다중 소스 정보 연결의 어려움을 해결하기 위해, 반복적인 과정을 통해 검색 다양성과 답변 질을 동시에 최적화하는 Vendi-RAG 프레임워크를 제안합니다. Vendi-RAG는 유연한 유사도 기반 다양성 지표인 Vendi Score (VS)를 활용하여 문서 검색의 의미적 다양성을 높이고, LLM 판단자를 통해 후보 답변을 평가하여 검색 과정에서 관련성과 다양성을 균형 있게 고려합니다. HotpotQA, MuSiQue, 2WikiMultiHopQA 데이터셋을 이용한 실험 결과, 기존 단일 단계 및 다단계 RAG 접근 방식에 비해 유의미한 정확도 향상을 보였으며, 특히 다중 호핑 추론 작업에서 효과적임을 입증했습니다. 다양한 LLM 백본(GPT-3.5, GPT-4, GPT-4o-mini)에서도 일관된 성능 향상을 보여 모델 독립적인 장점을 확인했습니다.