Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

P-TAME: Explain Any Image Classifier with Trained Perturbations

Created by
  • Haebom

저자

Mariano V. Ntrougkas, Vasileios Mezaris, Ioannis Patras

개요

본 논문에서는 딥 뉴럴 네트워크(DNN) 기반 이미지 분류기의 설명을 위한 모델-애그노스틱 방법인 P-TAME(Perturbation-based Trainable Attention Mechanism for Explanations)을 제시합니다. P-TAME은 보조 이미지 분류기를 사용하여 입력 이미지에서 특징을 추출하여 설명 방법을 설명 대상 백본 분류기의 내부 구조에 맞출 필요가 없도록 합니다. 기존의 perturbation-based 방법과 달리, P-TAME은 추론 중 단일 전방 패스에서 고해상도 설명을 생성하여 효율적인 대안을 제공합니다. VGG-16, ResNet-50, ViT-B-16 세 가지 이미지 분류기에 P-TAME을 적용하여 정량적 및 정성적 결과를 통해 기존 설명 가능성 방법, 특히 모델 특정 접근 방식과 비교하여 동등하거나 우수한 성능을 보임을 보여줍니다.

시사점, 한계점

시사점:
모델-애그노스틱 방식으로 다양한 DNN 구조에 적용 가능합니다.
기존 perturbation-based 방법보다 효율적인 고해상도 설명 생성이 가능합니다.
VGG-16, ResNet-50, ViT-B-16 등 다양한 모델에 대한 실험 결과를 통해 성능 우수성을 검증했습니다.
향후 코드 및 훈련된 모델 공개 예정입니다.
한계점:
본 논문에서는 이미지 분류기에만 적용되었으며, 다른 유형의 DNN에는 적용 가능성이 검증되지 않았습니다.
실제 적용 환경에서의 성능 및 안정성에 대한 추가적인 연구가 필요합니다.
설명의 신뢰성 및 해석 가능성에 대한 심층적인 분석이 필요합니다.
👍