Unveiling the Unseen: A Comprehensive Survey on Explainable Anomaly Detection in Images and Videos
작성자
Haebom
저자
Yizhou Wang, Dongliang Guo, Sheng Li, Octavia Camps, Yun Fu
개요
본 논문은 이미지 및 비디오 데이터에서의 설명 가능한 2D 시각적 이상 감지(X-VAD)에 대한 최초의 종합적인 조사 연구이다. 이미지 이상 감지(IAD)와 비디오 이상 감지(VAD) 방법 모두를 다루며, 주요 기여로 주의 기반, 생성 모델 기반, 추론 기반, 기초 모델 기반 등 기본 기술별로 분류된 설명 가능한 방법들에 대한 철저한 문헌 검토를 제시한다. 이미지 및 비디오 모달리티에서 이러한 방법들을 적용하는 데 있어 공통점과 차이점을 분석하고, 모달리티별 과제와 설명 가능성에 대한 기회를 강조한다. 또한, 관련 데이터셋과 평가 지표(성능 지표 및 설명 품질 평가 접근 방식 포함)를 요약하고, 설명 품질 정량화, 다양한 이상 감지 패러다임 설명, 상황 인식 향상, 기초 모델의 책임감 있는 활용, 효율성 및 강건성과 같은 실제 제약 해결 등 미래 방향과 미해결 문제를 논의한다. 관련 자료 모음은 https://github.com/wyzjack/Awesome-XAD 에서 확인할 수 있다.