Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Bilingual Dual-Head Deep Model for Parkinson's Disease Detection from Speech

Created by
  • Haebom
Category
Empty

저자

Moreno La Quatra, Juan Rafael Orozco-Arroyave, Marco Sabato Siniscalchi

개요

파킨슨병(PD) 검출을 위한 이중 헤드 심층 신경망 아키텍처를 제안하는 논문입니다. 이중 헤드 아키텍처는 하나는 디아도코키네틱 패턴에 특화되고 다른 하나는 연속적인 구어체에서 나타나는 자연스러운 음성 패턴을 분석합니다. 입력의 종류에 따라 두 헤드 중 하나만 작동합니다. 음성 표현은 자기 지도 학습(SSL) 모델과 웨이블릿 변환으로 추출하며, 적응형 레이어, 합성곱 병목 현상, 대조 학습을 활용하여 언어 간 변화를 줄입니다. 슬로바키아어(EWA-DB)와 스페인어(PC-GITA) 데이터셋을 사용하여 평가한 결과, 단일 언어 데이터셋으로 학습된 기존 모델은 언어 간 일반화에 어려움을 겪고 단순한 데이터셋 결합은 최적이 아니라는 것을 보여줍니다. 제안된 모델은 두 언어 모두에서 동시에 일반화 성능을 향상시킵니다.

시사점, 한계점

시사점: 이중 헤드 아키텍처를 통해 이중 언어 환경에서 파킨슨병 검출의 일반화 성능을 향상시킬 수 있음을 보여줍니다. 자기 지도 학습과 웨이블릿 변환, 적응형 레이어 등의 기법을 효과적으로 활용하여 언어 간 차이를 줄였습니다.
한계점: 제안된 모델의 성능 평가는 두 개의 특정 데이터셋(EWA-DB, PC-GITA)에 국한되어 있으며, 다른 언어나 데이터셋으로의 일반화 가능성은 추가적인 연구가 필요합니다. 더 다양한 언어와 더 큰 규모의 데이터셋을 사용한 실험이 필요합니다. 또한, 디아도코키네틱 패턴과 자연스러운 음성 패턴을 구분하는 기준과 그 효과에 대한 더 자세한 분석이 필요합니다.
👍