딥러닝 기반 원격 탐사 영상 장면 분류에서 레이블된 데이터 부족과 다양한 지리적 및 센서 도메인에서 발생하는 주석 비용 문제 해결을 위해, 시각-언어 모델(예: CLIP)을 활용한 프롬프트 학습을 탐구합니다. 여러 프롬프트 학습 방법(Context Optimization, Conditional Context Optimization, Multi-modal Prompt Learning, Prompting with Self-Regulating Constraints)을 평가하고, 제로샷 CLIP 및 CLIP 특징 기반 선형 프로브와 비교하여 몇몇 원격 탐사 데이터셋에 대한 광범위한 실험을 수행합니다. 그 결과 프롬프트 학습이 소수 샷 시나리오에서 일관되게 우수한 성능을 보였으며, 특히 Prompting with Self-Regulating Constraints가 가장 강력한 교차 도메인 성능을 보였습니다.