본 논문은 무인항공기(UAV)를 이용한 항공 객체 탐지에서 10픽셀 미만의 작은 표적, 밀집된 가림, 그리고 엄격한 계산 제약이라는 어려움을 해결하기 위해 Variable Receptive Field DETR (VRF-DETR)을 제안합니다. VRF-DETR은 트랜스포머 기반 탐지기로, 적응적 공간적 주의와 게이트가 있는 다중 스케일 융합을 통해 특징을 동적으로 재보정하는 다중 스케일 컨텍스트 융합(MSCF) 모듈, 심층 분리 연산과 동적 게이트를 통해 매개변수 효율적인 지역 컨텍스트 모델링을 가능하게 하는 게이트 컨볼루션(GConv) 레이어, 그리고 계단식 전역-지역 상호작용을 통해 가려진 물체를 계층적으로 분리하는 게이트가 있는 다중 스케일 융합(GMCF) 병목 현상이라는 세 가지 주요 구성 요소를 통합합니다. VisDrone2019 실험 결과, VRF-DETR은 13.5M 매개변수만으로 51.4% mAP₅₀ 및 31.8% mAP₅₀:₉₅를 달성하여 UAV 기반 탐지 작업에 대한 새로운 효율성-정확도 파레토 프런티어를 확립했습니다.