Infant Cry Detection Using Causal Temporal Representation
Created by
Haebom
Category
Empty
저자
Minghao Fu, Danning Li, Aryan Gadhiya, Benjamin Lambright, Mohamed Alowais, Mohab Bahnassy, Saad El Dine Elletter, Hawau Olamide Toyin, Haiyan Jiang, Kun Zhang, Hanan Aldarmaki
개요
본 논문은 다른 소리와 배경 잡음이 존재하는 환경에서의 아기 울음 감지라는 어려운 과제를 다룹니다. 특히, 정확하게 주석이 달린 데이터의 부족이라는 문제점을 해결하기 위해, 지도 학습 및 비지도 학습 기반의 아기 울음 감지에 대한 두 가지 기여를 제시합니다. 첫 번째는 울음 소리 분할을 위한 주석이 달린 데이터셋으로, 이를 통해 지도 학습 모델이 최첨단 성능을 달성할 수 있습니다. 또한, 인과적 시간적 표현에 기반한 새로운 비지도 학습 방법인 Causal Representation Sparse Transition Clustering (CRSTC)을 제안하여 데이터 부족 문제를 더욱 일반적으로 해결하는 데 도움을 줍니다. 감지된 울음 소리 구간을 통합함으로써, 후속 아기 울음 분류의 성능을 크게 향상시켜 아기 돌봄 응용 프로그램에 대한 이 방법의 잠재력을 강조합니다.