본 논문은 원격 감지 이미지 초고해상도화를 위해 강화 학습 기반 잠재 확산 모델(LDM) 미세 조정 방법을 제안합니다. 기존 심층 학습 방식의 한계를 극복하고자, 근접 정책 최적화(PPO)를 통해 LDM의 역 잡음 제거 과정에서 의사결정 목표를 최적화하는 강화 학습 환경을 구축합니다. RESISC45 데이터셋 실험 결과, 기준 모델 대비 PSNR 34dB 증가, SSIM 0.080.11 향상, LPIPS 0.06~0.10 감소 등의 성능 향상을 보이며, 특히 구조화되고 복잡한 자연 장면에서 효과적임을 확인했습니다.