본 논문에서는 계층적 트랜스포머 프레임워크 내에 웨이블릿 변환을 통합한 새로운 이미지 초고해상도(SR) 방법인 WaveHiT-SR을 제안합니다. 기존 트랜스포머 기반 SR 방법들의 제한적인 수용 영역을 극복하기 위해, 고정된 작은 창 대신 적응형 계층적 창을 사용하여 다양한 레벨의 특징을 포착하고 장거리 의존성 모델링 능력을 향상시킵니다. 또한, 웨이블릿 변환을 이용하여 이미지를 여러 주파수 대역으로 분해하여 전역 및 지역적 특징 모두에 집중하면서 구조적 디테일을 보존합니다. 계층적 처리를 통해 고해상도 이미지를 점진적으로 재구성하여 계산 복잡도를 줄이면서 성능 저하를 방지합니다. 다양한 실험을 통해 WaveHiT-SR의 효과와 효율성을 확인하였으며, SwinIR-Light, SwinIR-NG, SRFormer-Light의 개선된 버전을 통해 더 높은 효율성(더 적은 파라미터, 낮은 FLOPs, 더 빠른 속도)과 최첨단 SR 결과를 달성했습니다.