본 논문에서는 딥 뉴럴 네트워크(DNN) 기반 이미지 분류기의 설명을 위한 모델-애그노스틱 방법인 P-TAME(Perturbation-based Trainable Attention Mechanism for Explanations)을 제시합니다. P-TAME은 보조 이미지 분류기를 사용하여 입력 이미지에서 특징을 추출하여 설명 방법을 설명 대상 백본 분류기의 내부 구조에 맞출 필요가 없도록 합니다. 기존의 perturbation-based 방법과 달리, P-TAME은 추론 중 단일 전방 패스에서 고해상도 설명을 생성하여 효율적인 대안을 제공합니다. VGG-16, ResNet-50, ViT-B-16 세 가지 이미지 분류기에 P-TAME을 적용하여 정량적 및 정성적 결과를 통해 기존 설명 가능성 방법, 특히 모델 특정 접근 방식과 비교하여 동등하거나 우수한 성능을 보임을 보여줍니다.