From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms
작성자
Haebom
카테고리
비어 있음
저자
Manuel Barusco, Francesco Borsatti, Davide Dalle Pezze, Francesco Paissan, Elisabetta Farella, Gian Antonio Susto
개요
본 논문은 영상 이상 탐지(VAD) 알고리즘을 오디오 이상 탐지(AAD)에 적용하여, 기존의 단순 이상 샘플 분류 방식과 달리 스펙트로그램 내에서 이상 현상의 시간-주파수 영역을 정밀하게 찾아냄으로써 설명력을 크게 향상시킨 연구를 제시합니다. 사전 훈련된 특징 추출기를 사용하여 생성된 임베딩을 활용하는 정교한 알고리즘을 기반으로 하며, 산업 및 환경 벤치마크에서 효과를 입증합니다. 이를 통해 오디오 이상 탐지 시스템의 해석력과 실용성을 높입니다.