LP-DETR은 DETR 기반 객체 탐지 성능을 향상시키는 새로운 방법으로, 다중 스케일 관계 모델링을 통해 객체 쿼리 간의 학습 가능한 공간적 관계를 도입합니다. 관계 인식 자기 주의 메커니즘을 사용하여 디코더 계층 간의 다양한 스케일 관계(국소, 중간, 전역)의 균형을 적응적으로 학습합니다. 이러한 점진적인 설계를 통해 모델은 탐지 파이프라인 전체에서 진화하는 공간적 의존성을 효과적으로 포착할 수 있습니다. COCO 2017 데이터셋에서의 광범위한 실험을 통해 표준 자기 주의 메커니즘과 비교하여 수렴 속도와 탐지 정확도가 모두 향상됨을 보여줍니다. 제안된 방법은 ResNet-50 백본을 사용하여 12 에포크에서 52.3% AP, 24 에포크에서 52.5% AP의 경쟁력 있는 결과를 달성했으며, Swin-L 백본을 사용하면 58.0% AP까지 향상됩니다. 또한, 모델이 초기 디코더 계층에서는 국소 공간 관계를 우선적으로 학습하고, 더 깊은 계층에서는 점진적으로 더 넓은 맥락에 주의를 돌리는 흥미로운 패턴을 보이는 것을 분석을 통해 밝혀냈습니다.