DETR(DEtection TRansformer)은 end-to-end 객체 탐지 아키텍처로 유망하지만, 실제 객체 수보다 훨씬 많은 예측값을 생성합니다. 본 논문은 동일 이미지 내 다양한 예측값의 신뢰도 수준이 다르다는 것을 실증적으로 보여줍니다. 한 객체에 대해 여러 예측이 이루어지지만, 그 중 하나만 정확도가 높고 나머지는 낮다는 것을 발견했습니다. 따라서 DETR의 신뢰할 수 있는 예측값을 식별하는 것이 객체 및 이미지 수준 모두에서 모델의 신뢰도를 정확하게 평가하는 데 중요함을 강조합니다. 기존 평가 지표의 한계를 지적하고, 객체 수준 보정 오차(OCE)를 제시하여 모델 간 비교 및 가장 신뢰할 수 있는 예측값 식별을 개선합니다. 마지막으로, 이미지별 모델 정확도를 예측하는 사후 확률적 불확실성 정량화(UQ) 프레임워크를 제시하여, OCE에 의해 결정된 양성 및 음성 예측의 평균 신뢰도 점수를 비교하여 각 테스트 이미지에 대한 DETR 모델의 신뢰도를 평가합니다.