본 논문은 신뢰할 수 있는 검색 증강 생성(RAG) 시스템 구축에 있어 개별 구성 요소의 성능보다 구성 요소 간의 상호 작용의 중요성을 강조합니다. 50개의 쿼리(15개는 답할 수 있음, 10개는 가장자리 경우, 25개는 적대적)에 대한 제거 연구를 통해 하이브리드 검색, 앙상블 검증, 적응형 임계값 설정과 같은 개선 사항이 단독으로 사용될 때는 거의 이점이 없지만, 함께 사용하면 환각 증가 없이 기권율을 95% 감소(40%에서 2%로)시키는 것을 보여줍니다. 또한, 다양한 검증 전략이 안전하게 작동하지만 일관성 없는 레이블(예: "기권" vs "지원되지 않음")을 할당하여 실제로는 레이블링의 인위적인 결과인 환각률을 생성하는 측정 문제를 식별합니다.