본 논문은 여러 모듈로 구성된 Retrieval Augmented Generation (RAG) 시스템의 성능 향상을 위해, 모듈들을 개별적으로 학습하는 기존 방식 대신 통합 최적화를 제안합니다. 특히, 정책 네트워크와 검색기를 포함하는 SmartRAG라는 파이프라인을 설계하여, 정책 네트워크가 검색 시점 결정, 쿼리 재작성, 답변 생성 등의 역할을 수행하도록 합니다. 강화 학습 알고리즘을 이용하여 시스템 전체를 최적화하며, 최소한의 검색 비용으로 최상의 성능을 달성하도록 보상 함수를 설계했습니다. 실험 결과, 통합 최적화된 SmartRAG가 개별 최적화된 시스템보다 더 나은 성능을 달성함을 보여줍니다.