Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

National Institute on Aging PREPARE Challenge: Early Detection of Cognitive Impairment Using Speech - The SpeechCARE Solution

Created by
  • Haebom
Category
Empty

저자

Maryam Zolnoori, Hossein Azadmaleki, Yasaman Haghbin, Ali Zolnour, Mohammad Javad Momeni Nezhad, Sina Rashidi, Mehdi Naserian, Elyas Esmaeili, Sepehr Karimi Arpanahi

개요

SpeechCARE는 알츠하이머병 및 관련 치매(ADRD) 조기 진단을 위해 사전 훈련된 다국어 음향 및 언어 변환기 모델을 활용하는 다중 모달 음성 처리 파이프라인입니다. 음성 관련 단서를 포착하기 위해 동적 융합 아키텍처를 사용하여 다양한 변환기 기반 입력(음향, 언어, 인구 통계)을 가중합니다. 자동 전사, LLM 기반 이상 감지 및 작업 식별과 같은 강력한 전처리를 포함하며, SHAP 기반 설명 가능성 모듈과 LLM 추론을 사용하여 각 모달리티의 기여도를 강조합니다. MCI 및 AD 환자 분류에서 AUC = 0.88 및 F1 = 0.72, MCI 감지에서 AUC = 0.90 및 F1 = 0.62를 달성했습니다.

시사점, 한계점

시사점:
다중 모달 접근 방식을 통한 ADRD 조기 진단의 가능성 제시
사전 훈련된 변환기 모델의 활용으로 성능 향상
설명 가능성 모듈을 통해 모델의 의사 결정 과정 투명성 확보
다양한 인구 집단에 대한 적용 가능성 및 편향 완화 노력
한계점:
80세 이상 성인에서 편향 발생
실제 의료 환경에서의 배포 및 통합 필요
뉴욕시의 소외된 인구 집단에 대한 설명 가능성 개선 필요
👍