고해상도 RGB 영상으로부터 정확한 건물 분할은 건물과 비건물 특징 간의 스펙트럼 유사성, 그림자, 불규칙적인 건물 형태 등으로 인해 어려움을 겪고 있습니다. 본 연구에서는 0.4m~2.7m의 공간 해상도를 가진 RGB 항공 및 위성 영상을 사용하여 다중 스케일 건물 분할을 위한 포괄적인 심층 학습 프레임워크를 제시합니다. 다양한 멀티센서 데이터셋을 구성하고, PCA, VDVI, MBI, Sobel 에지 필터를 RGB 채널에서 유도하여 보조 표현을 포함하는 특징이 강화된 입력을 도입합니다. 이러한 특징들은 Res-U-Net 아키텍처가 복잡한 공간 패턴을 더 효과적으로 학습하도록 안내합니다. 또한, 계층 동결, 순환 학습률, SuperConvergence를 통합하는 학습 정책을 제안하여 학습 시간 및 자원 사용량을 줄입니다. 분리된 WorldView-3 영상에 대한 평가에서, 제안된 모델은 전반적인 정확도 96.5%, F1-점수 0.86, IoU 0.80을 달성하여 기존 RGB 기반 벤치마크를 능가합니다. 본 연구는 원격 감지 응용 분야에서 강력한 건물 분할을 위한 다중 해상도 영상, 특징 증강 및 최적화된 학습 전략 결합의 효과를 보여줍니다.