Sign In

Audio Signal Processing Using Time Domain Mel-Frequency Wavelet Coefficient

Created by
  • Haebom
Category
Empty

저자

Rinku Sebastian, Simon O'Keefe, Martin Trefzer

개요

본 논문은 음성 신호 처리에서 중요한 특징 추출 방법론을 제시한다. 기존 널리 사용되는 Mel Frequency Cepstral Coefficients (MFCC)의 단점인 시간 정보를 보완하기 위해 웨이블릿 변환을 활용한 새로운 특징 추출 방법을 제안한다. 특히, 웨이블릿 변환 기반 Mel-scale 특징 추출 방식의 높은 계산 복잡성을 해결하기 위해, 시간 도메인에서 Mel scale 특징을 추출하는 Time domain Mel frequency Wavelet Coefficient (TMFWC) 기법을 제안하고, 이를 reservoir computing에 적용하여 오디오 신호 처리의 효율성을 개선한다.

시사점, 한계점

TMFWC 기법을 통해 시간-주파수 변환 및 웨이블릿 추출 과정의 복잡성을 줄여 계산 효율성을 향상시킴.
reservoir computing과의 결합을 통해 오디오 신호 처리 성능을 개선.
논문에서 구체적인 실험 결과 및 성능 비교에 대한 상세 정보는 제시되지 않음.
제안된 TMFWC 기법의 일반적인 음성 인식/분류 task에서의 성능 검증 필요.
다양한 오디오 신호 처리에 대한 TMFWC의 일반화 가능성 및 활용성 검토 필요.
👍