본 논문은 감자 작물의 항공 영상을 이용하여, 비침습적 영상 기법과 머신러닝을 통해 가뭄 스트레스를 조기에 감지하는 설명 가능한 심층 학습 파이프라인을 제안한다. Vision Transformer (ViT)를 활용하여 항공 영상에서 복잡한 공간적 특징을 추출하고, Support Vector Machine (SVM) 또는 ViT 내부의 분류 계층을 사용하여 가뭄 스트레스를 감지하는 두 가지 접근 방식을 제시한다. ViT 모델의 의사결정 과정을 시각화하는 어텐션 맵을 통해 가뭄 스트레스의 미묘한 식물 특징을 강조하여 모델의 해석성을 높였다. 제안된 방법은 높은 정확도로 가뭄 스트레스를 식별하고, 농민의 정보에 입각한 의사결정을 지원하여 작물 관리 개선에 기여한다.