의료 및 생명 공학 분야에서 대규모 언어 모델을 통합하는 데 있어 검색 증강 생성(RAG)이 부상하고 있지만, 보호된 건강 정보(PHI) 노출과 같은 개인 정보 보호 위험이 여전히 일관되지 않게 완화되고 있습니다. 이 연구는 (i) 임상 시나리오 전반의 민감한 데이터 유형, (ii) 관련 개인 정보 보호 위험, (iii) 현재 및 새로운 데이터 개인 정보 보호 메커니즘, (iv) 환자 데이터 개인 정보 보호를 위한 미래 방향을 포함하여 의료 분야에서 RAG 애플리케이션의 현재 상황에 대한 철저한 분석을 제공합니다. 23개의 의료 분야의 RAG 애플리케이션 논문을 종합하여 데이터 저장, 전송, 검색 및 생성 단계를 포괄하는 파이프라인 구조 프레임워크를 통해 개인 정보 보호 문제를 체계적으로 분석하여 잠재적인 고장 모드, 위협 모델 및 시스템 메커니즘의 근본적인 원인, 그리고 실질적인 의미를 파악합니다. 이 분석을 바탕으로 RAG 시스템을 위한 개인 정보 보호 전략에 대한 17개의 논문을 비판적으로 검토합니다.