본 논문은 Retrieval Augmented Generation (RAG) 시스템의 보안 및 프라이버시 문제에 초점을 맞추고 있다. RAG는 대규모 언어 모델(LLM)을 재훈련하거나 미세 조정하지 않고도 데이터를 통합할 수 있게 하여 응답의 질과 정확도를 높이지만, 민감한 데이터가 통합될 경우 새로운 보안 및 프라이버시 문제를 야기한다. 논문에서는 RAG 파이프라인의 취약성을 검토하고, 데이터 전처리 및 저장 관리부터 LLM과의 통합까지의 공격 표면을 개괄한다. 이러한 위험을 식별하고, 구조적인 개요에서 해당 완화 방안을 제시한다. 또한, RAG 특유의 보안 고려 사항과 기존의 일반적인 보안 지침, 업계 표준 및 모범 사례를 결합한 프레임워크를 개발하여 강력하고, 규정을 준수하며, 안전하고 신뢰할 수 있는 RAG 시스템 구현을 위한 지침을 제공한다.