본 논문은 자율주행 및 의료와 같이 중요한 영역에서 널리 사용되는 심층 신경망(DNN)의 잘못된 예측을 감지하고 적절히 개입하는 능력의 중요성을 강조합니다. 이를 위해 적대적 방해의 관점에서 이미지 분류 모델의 잘못 분류된 입력 감지를 연구하며, 강건한 반경(입력 공간 마진)을 신뢰도 지표로 사용하고 잘못 분류 감지를 위한 두 가지 효율적인 추정 알고리즘인 RR-BS와 RR-Fast를 제안합니다. 또한, 모델의 실수 식별 능력을 향상시키는 Radius Aware Training (RAT)이라는 훈련 방법을 제안합니다. 광범위한 실험을 통해 기존 방법에 비해 AURC를 최대 29.3% 감소시키고 FPR@95TPR을 21.62% 감소시킬 수 있음을 보여줍니다.