본 연구는 자연어 처리 기법을 활용하여 임상 면접 기록에서 PTSD를 자동으로 감지하는 방법을 평가했습니다. DAIC-WOZ 데이터셋을 사용하여 일반 및 정신 건강 특화 Transformer 모델(BERT/RoBERTa), 임베딩 기반 방법(SentenceBERT/LLaMA), 그리고 대규모 언어 모델 프롬프팅 전략(제로샷/퓨샷/사고연쇄)을 비교 분석했습니다. 정신 건강 특화 모델이 일반 모델보다 성능이 훨씬 우수했으며(Mental-RoBERTa F1=0.643 vs. RoBERTa-base 0.485), 신경망과 함께 LLaMA 임베딩을 사용한 방법이 최고 성능(F1=0.700)을 달성했습니다. DSM-5 기준을 사용한 제로샷 프롬프팅 또한 훈련 데이터 없이 경쟁력 있는 결과(F1=0.657)를 보였습니다. 성능은 증상 심각도와 동반 질환 상태에 따라 크게 달라졌으며, 심각한 PTSD 환자와 우울증 동반 환자에게서 정확도가 더 높았습니다. 이 연구는 도메인 적응 임베딩과 LLMs의 확장 가능한 스크리닝 잠재력을 강조하는 동시에, 미묘한 증상 표현의 감지 개선 및 임상적으로 실용적인 PTSD 평가 AI 도구 개발에 대한 통찰력을 제공합니다.