본 논문은 Retrieval Augmented Generation (RAG) 시스템의 보안 및 개인 정보 보호 문제를 다룹니다. RAG는 대규모 언어 모델(LLM)의 재훈련 없이 데이터를 통합하여 응답의 정확성을 높이는 기술이지만, 민감한 데이터를 통합할 경우 새로운 보안 및 개인 정보 위협을 야기합니다. 논문에서는 RAG 파이프라인의 취약성을 검토하고, 데이터 전처리, 데이터 저장 관리부터 LLM 통합까지의 공격 표면을 개괄합니다. 이러한 위험 요소들에 대한 완화 방안을 제시하고, RAG 특유의 보안 고려 사항과 기존 일반적인 보안 지침, 산업 표준 및 모범 사례를 결합한 프레임워크를 개발하여 안전하고 신뢰할 수 있는 RAG 시스템 구현을 위한 가이드라인을 제공합니다.