DEIM(Dense Efficiently-Improved Matching)은 Transformer 기반 실시간 객체 탐지 모델(DETR)의 수렴 속도를 높이기 위한 효율적인 훈련 프레임워크입니다. 기존 DETR의 일대일 매칭의 희소한 감독 문제를 해결하기 위해, DEIM은 일반적인 데이터 증강 기법을 사용하여 추가적인 타겟을 포함하는 Dense O2O 매칭 전략을 사용합니다. Dense O2O 매칭으로 인해 발생하는 저품질 매칭 문제는 Matchability-Aware Loss(MAL)라는 새로운 손실 함수를 통해 해결합니다. COCO 데이터셋에서의 실험 결과, RT-DETR 및 D-FINE과 통합된 DEIM은 성능을 향상시키는 동시에 훈련 시간을 50% 단축시킵니다. 특히 RT-DETRv2와 함께 사용하면 NVIDIA 4090 GPU에서 하루 만에 53.2% AP를 달성합니다. 또한, 추가 데이터 없이도 기존 최고 성능의 실시간 객체 탐지기보다 우수한 성능을 보입니다. (DEIM-D-FINE-L: 54.7% AP at 124 FPS, DEIM-D-FINE-X: 56.5% AP at 78 FPS on NVIDIA T4 GPU)