본 논문은 의료 진단에 AI 기반 텍스트-이미지 생성 모델을 통합하는 MEDVQA-GI 챌린지에 대한 연구를 다룹니다. 기존 방법들이 정적 이미지 분석에 초점을 맞춘 것과 달리, 본 연구는 미세 조정된 생성 모델을 기반으로 텍스트 설명에서 동적이고 확장 가능하며 정확한 의료 이미지를 생성하는 새로운 접근 방식을 제시합니다. 특히, Stable Diffusion과 DreamBooth 모델, 그리고 Low-Rank Adaptation (LORA)을 통합하여 고품질 의료 이미지를 생성합니다. 이미지 합성(IS)과 최적 프롬프트 생성(OPG) 두 가지 하위 작업으로 구성되며, Stable Diffusion이 이미지 품질과 다양성 측면에서 CLIP 및 DreamBooth + LORA보다 우수한 성능을 보임을 평가 지표(FID, Inception Score)를 통해 보여줍니다.