본 논문은 고해상도 디지털 표면 모델(DSM)을 활용하여 도시 환경, 특히 건물 수준 분석에 대한 이해도를 높이는 새로운 사전 학습 모델 HiRes-FusedMIM을 제시합니다. HiRes-FusedMIM은 고해상도 RGB와 DSM 데이터의 풍부한 정보를 활용하도록 설계된 이중 인코더 SimMIM(Simple Masked Image Modeling) 아키텍처를 사용하며, 재구성 및 대조 목표를 결합한 다중 목표 손실 함수를 사용합니다. 다양한 하위 작업(분류, 의미론적 분할, 인스턴스 분할)에 대한 종합적인 평가 결과, HiRes-FusedMIM은 기존 최첨단 지리 공간 방법들을 능가하는 성능을 보였으며, 특히 DSM 통합의 효과와 이중 인코더 아키텍처의 우수성을 확인했습니다. 학습된 모델 가중치는 공개될 예정입니다.