[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models

Created by
  • Haebom

저자

Feng Chen, Dror Ben-Zeev, Gillian Sparks, Arya Kadakia, Trevor Cohen

개요

본 연구는 임상 환경에서 저진단되는 외상 후 스트레스 장애(PTSD)의 자동 탐지를 위한 자연어 처리 접근법을 평가했습니다. DAIC-WOZ 데이터셋을 사용하여 일반 및 정신 건강 특화 Transformer 모델(BERT/RoBERTa), 임베딩 기반 방법(SentenceBERT/LLaMA), 그리고 대규모 언어 모델 프롬프팅 전략(제로샷/퓨샷/사고연쇄)을 비교했습니다. 정신 건강 특화된 엔드-투-엔드 모델이 일반 모델보다 성능이 훨씬 우수했으며 (Mental-RoBERTa AUPRC=0.675+/-0.084 vs. RoBERTa-base 0.599+/-0.145), 신경망을 사용한 SentenceBERT 임베딩이 전반적으로 가장 높은 성능(AUPRC=0.758+/-0.128)을 달성했습니다. DSM-5 기준을 사용한 퓨샷 프롬프팅도 두 가지 예시만으로 경쟁력 있는 결과(AUPRC=0.737)를 보였습니다. 성능은 증상 심각도와 우울증 동반 질환 상태에 따라 크게 달라졌으며, 심각한 PTSD 환자와 우울증 동반 질환 환자에게서 정확도가 더 높았습니다. 이러한 결과는 도메인 적응 임베딩과 LLM이 확장 가능한 선별 검사에 잠재력을 가지고 있음을 강조하지만, 미묘한 증상 표현의 개선된 탐지와 임상적으로 실행 가능한 PTSD 평가 AI 도구 개발에 대한 통찰력을 제공할 필요성을 강조합니다.

시사점, 한계점

시사점:
도메인 특화된 임베딩 및 대규모 언어 모델(LLM)을 활용하여 PTSD를 효과적으로 스크리닝할 수 있는 잠재력을 확인했습니다. 특히 SentenceBERT 임베딩과 퓨샷 프롬프팅 기법이 우수한 성능을 보였습니다.
PTSD의 심각도와 우울증과 같은 동반 질환의 존재 여부가 PTSD 진단 정확도에 영향을 미친다는 사실을 밝혔습니다.
본 연구는 임상적으로 활용 가능한 PTSD 평가 AI 도구 개발을 위한 중요한 통찰력을 제공합니다.
한계점:
미묘한 PTSD 증상 표현에 대한 탐지 성능 개선이 필요합니다.
증상 심각도 및 동반 질환에 따른 성능 차이에 대한 추가 연구가 필요합니다.
DAIC-WOZ 데이터셋에 대한 의존성으로 인한 일반화 가능성에 대한 검토가 필요합니다.
👍