[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Reading Between the Lines: Combining Pause Dynamics and Semantic Coherence for Automated Assessment of Thought Disorder

Created by
  • Haebom

저자

Feng Chen, Weizhe Xu, Changye Li, Serguei Pakhomov, Alex Cohen, Simran Bhola, Sandy Yin, Sunny X Tang, Michael Mackinley, Lena Palaniyappan, Dror Ben-Zeev, Trevor Cohen

개요

본 연구는 조현병 스펙트럼 장애의 핵심 증상인 형식적 사고 장애(FTD)의 객관적이고 확장 가능한 평가를 위해 자동 음성 인식(ASR) 기술을 활용하였다. 기존의 임상 평가척도의 한계를 극복하고자, ASR을 통해 얻은 음성의 언어적 및 시간적 특징, 특히 멈춤(pause) 동작을 분석하여 FTD 중증도 예측에 활용하였다. 세 가지 데이터셋(자연스러운 자기 기록 일기, 구조화된 그림 설명, 꿈 이야기)을 이용하여 멈춤 관련 특징과 기존의 의미 일관성 척도를 결합하여 지지 벡터 회귀(SVR) 분석을 수행하였다. 그 결과, 멈춤 특징만으로도 FTD 중증도를 강력하게 예측할 수 있었으며, 멈춤 특징과 의미 일관성 척도를 통합한 모델은 의미만 고려한 모델보다 예측 성능이 향상되었음을 확인하였다(최대 상관계수 ρ = 0.649, AUC = 83.71%). 이러한 결과는 시간적 및 의미적 분석을 결합하는 프레임워크가 조직되지 않은 언어의 평가를 개선하고 정신병에서 자동 음성 분석을 발전시키는 데 기여할 수 있음을 시사한다.

시사점, 한계점

시사점:
자동 음성 인식(ASR) 기반의 객관적이고 확장 가능한 FTD 평가 방법 제시.
멈춤(pause) 특징이 FTD 중증도 예측에 중요한 역할을 함을 증명.
멈춤 특징과 의미 일관성 척도 통합을 통한 FTD 예측 성능 향상 확인.
다양한 상황(자연스러운 일기, 그림 설명, 꿈 이야기)에서 일관된 성능 향상을 보임.
한계점:
사용된 데이터셋의 규모가 상대적으로 작을 수 있음.
다양한 언어 및 문화적 배경에 대한 일반화 가능성에 대한 추가 연구 필요.
멈춤 패턴의 데이터셋 의존성이 존재함.
임상적 활용을 위한 추가 검증 및 표준화 과정 필요.
👍