고해상도 원격 감지(HRRS) 영상 분할은 복잡한 공간 배치와 다양한 객체 모양으로 인해 어려운 과제입니다. CNN은 국부적 특징을 잘 포착하지만 장거리 의존성에는 어려움을 겪는 반면, Transformer는 전역적 맥락을 모델링할 수 있지만 국부적 세부 사항을 종종 무시하고 계산 비용이 많이 듭니다. 본 논문에서는 두 가지 구성 요소, 즉 상황 인식 영역 주의(CRA)와 전역 클래스 개선(GCR)으로 구성된 새로운 방법인 영역 인식 프록시 네트워크(RAPNet)를 제안합니다. 기존의 격자 기반 배치에 의존하는 방법과 달리, RAPNet은 보다 유연한 분할을 위해 영역 수준에서 작동합니다. CRA 모듈은 Transformer를 사용하여 영역 수준의 상황적 의존성을 포착하고 의미 영역 마스크(SRM)를 생성합니다. GCR 모듈은 다중 클래스 정보를 개선하기 위해 전역 클래스 주의 지도를 학습하고, 정확한 분할을 위해 SRM과 주의 지도를 결합합니다. 세 개의 공개 데이터 세트에 대한 실험 결과, RAPNet은 최첨단 방법보다 우수한 성능을 보이며, 우수한 다중 클래스 분할 정확도를 달성했습니다.