본 논문은 Retrieval-Augmented Generation (RAG)에 대한 종합적인 개요를 제공합니다. RAG는 대규모 검색 시스템과 생성 모델을 결합하여 자연어 이해 및 생성을 향상시키는 기술입니다. 논문에서는 RAG의 핵심 구성 요소(검색 메커니즘, 생성 프로세스, 두 요소 간 통합), 특징(동적 외부 지식을 사용한 생성 모델 증강), 그리고 생성 목표와 검색 정보의 정합과 같은 과제를 논의합니다. 또한 다양한 RAG 방법들을 분류하는 분류 체계를 제시하고(기본적인 방법부터 다중 모드 데이터 및 추론 기능을 통합하는 고급 모델까지), 평가 벤치마크 및 데이터셋을 검토하며, 질의응답, 요약, 정보 검색 등 다양한 분야에서의 응용 사례를 살펴봅니다. 마지막으로, 검색 효율 향상, 모델 해석성, 도메인 특화 적응 등 RAG 시스템 개선을 위한 새로운 연구 방향과 기회를 강조하고 실제 문제 해결 및 자연어 처리 발전에 대한 전망을 제시합니다.