본 논문은 개인정보 보호 문제로 인해 제한적인 접근성을 가진 고품질 의료 데이터 문제를 해결하기 위해, GPT-4 API를 이용한 프롬프트 엔지니어링으로 고품질 합성 데이터셋을 생성하는 방법을 제시합니다. 생성된 데이터는 환자 입원 정보(의료 제공자 정보, 병원 부서, 병동, 병상 배정, 환자 인구 통계, 비상 연락처, 활력 징후, 예방 접종, 알레르기, 병력, 예약, 병원 방문, 실험실 검사, 진단, 치료 계획, 약물, 임상 기록, 방문 기록, 퇴원 요약, 의뢰)를 포괄적으로 포함합니다. BERT, GPT-2, RoBERTa, 오토인코더 등을 이용한 고급 검증 기법을 통해 데이터 품질과 무결성을 보장하고, 검증 기준을 충족한 합성 데이터는 PostgreSQL 데이터베이스에 통합되어 EHR 애플리케이션의 데이터 관리 시스템으로 활용됩니다. 이는 엄격한 검증을 거친 생성 AI 모델을 활용하여 개인정보 보호 문제를 해결하면서 AI 알고리즘 학습에 효과적으로 사용 가능한 고품질 합성 의료 데이터를 생성할 수 있음을 보여줍니다.