Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models

Created by
  • Haebom

저자

Feng Chen, Dror Ben-Zeev, Gillian Sparks, Arya Kadakia, Trevor Cohen

개요

본 연구는 자연어 처리 기법을 활용하여 임상 면접 기록에서 PTSD를 자동으로 감지하는 방법을 평가했습니다. DAIC-WOZ 데이터셋을 사용하여 일반 및 정신 건강 특화 Transformer 모델(BERT/RoBERTa), 임베딩 기반 방법(SentenceBERT/LLaMA), 그리고 대규모 언어 모델 프롬프팅 전략(제로샷/퓨샷/사고연쇄)을 비교 분석했습니다. 정신 건강 특화 모델이 일반 모델보다 성능이 훨씬 우수했으며(Mental-RoBERTa F1=0.643 vs. RoBERTa-base 0.485), 신경망과 함께 LLaMA 임베딩을 사용한 방법이 최고 성능(F1=0.700)을 달성했습니다. DSM-5 기준을 사용한 제로샷 프롬프팅 또한 훈련 데이터 없이 경쟁력 있는 결과(F1=0.657)를 보였습니다. 성능은 증상 심각도와 동반 질환 상태에 따라 크게 달라졌으며, 심각한 PTSD 환자와 우울증 동반 환자에게서 정확도가 더 높았습니다. 이 연구는 도메인 적응 임베딩과 LLMs의 확장 가능한 스크리닝 잠재력을 강조하는 동시에, 미묘한 증상 표현의 감지 개선 및 임상적으로 실용적인 PTSD 평가 AI 도구 개발에 대한 통찰력을 제공합니다.

시사점, 한계점

시사점:
도메인 특화 Transformer 모델 및 LLaMA 임베딩 기반 방법이 PTSD 자동 감지에 효과적임을 확인.
대규모 언어 모델의 제로샷 프롬프팅을 통해 훈련 데이터 없이도 경쟁력 있는 성능 달성 가능성 제시.
PTSD 심각도 및 동반 질환에 따른 성능 차이를 분석하여 향후 연구 방향 제시.
확장 가능한 PTSD 스크리닝 도구 개발 가능성 제시.
한계점:
증상 심각도 및 동반 질환에 따라 성능 차이가 존재하여, 미묘한 증상 표현의 감지 개선 필요.
임상적으로 실용적인 AI 도구 개발을 위한 추가 연구 필요.
특정 데이터셋(DAIC-WOZ)에 대한 결과이므로 일반화 가능성에 대한 추가 검증 필요.
👍