Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Unveiling the Unseen: A Comprehensive Survey on Explainable Anomaly Detection in Images and Videos

작성자
  • Haebom

저자

Yizhou Wang, Dongliang Guo, Sheng Li, Octavia Camps, Yun Fu

개요

본 논문은 이미지 및 비디오 데이터에서의 설명 가능한 2D 시각적 이상 감지(X-VAD)에 대한 최초의 종합적인 조사 연구이다. 이미지 이상 감지(IAD)와 비디오 이상 감지(VAD) 방법 모두를 다루며, 주요 기여로 주의 기반, 생성 모델 기반, 추론 기반, 기초 모델 기반 등 기본 기술별로 분류된 설명 가능한 방법들에 대한 철저한 문헌 검토를 제시한다. 이미지 및 비디오 모달리티에서 이러한 방법들을 적용하는 데 있어 공통점과 차이점을 분석하고, 모달리티별 과제와 설명 가능성에 대한 기회를 강조한다. 또한, 관련 데이터셋과 평가 지표(성능 지표 및 설명 품질 평가 접근 방식 포함)를 요약하고, 설명 품질 정량화, 다양한 이상 감지 패러다임 설명, 상황 인식 향상, 기초 모델의 책임감 있는 활용, 효율성 및 강건성과 같은 실제 제약 해결 등 미래 방향과 미해결 문제를 논의한다. 관련 자료 모음은 https://github.com/wyzjack/Awesome-XAD 에서 확인할 수 있다.

시사점, 한계점

시사점:
X-VAD 분야에 대한 최초의 종합적인 조사 연구 제공
다양한 설명 가능한 방법들의 체계적인 분류 및 분석
이미지 및 비디오 모달리티에 대한 설명 가능성의 과제와 기회 제시
설명 품질 평가를 위한 새로운 지표 및 접근 방식 소개
X-VAD 분야의 미래 연구 방향 제시 및 관련 자료 모음 제공
한계점:
본 논문 자체가 설명 가능한 방법에 대한 평가 및 비교를 직접 수행하지 않고 문헌 검토에 집중.
설명 품질 정량화에 대한 구체적인 방법론 제시 부족.
실제 응용 사례에 대한 심층적인 분석 부족.
최신 연구 동향의 빠른 변화에 따라 일부 정보가 시대에 뒤떨어질 가능성.
👍