본 논문은 외상 후 스트레스 장애(PTSD) 치료를 위한 연장 노출 요법(Prolonged Exposure therapy) 프로토콜을 기반으로 생성된 3,000개의 치료 대화를 포함하는 합성 벤치마크 데이터셋인 "Thousand Voices of Trauma"를 제시합니다. 이 데이터셋은 18세에서 80세 사이의 다양한 인구통계적 프로필(남성 49.4%, 여성 44.4%, 비이성애자 6.2%)과 20가지 유형의 외상, 10가지 외상 관련 행동을 포함하며, 각각 500개의 고유한 사례를 6가지 대화 관점으로 탐구하여 치료의 진행 과정을 반영합니다. 결정적 및 확률적 생성 방법을 사용하여 생성되었으며, 외상 유형(폭력 목격 10.6%, 괴롭힘 10.2%) 및 증상(악몽 23.4%, 약물 남용 20.8%)의 현실적인 분포를 보여줍니다. 임상 전문가는 데이터셋의 치료적 충실도를 검증했으며, 모델 응답 평가를 위한 표준화된 지표를 갖춘 감정적 궤적 벤치마크도 개발되었습니다. 개인 정보 보호가 유지되는 이 데이터셋은 외상 중심 정신 건강 데이터의 중요한 공백을 해결하여 환자 대면 애플리케이션과 임상의 훈련 도구 발전에 귀중한 자료를 제공합니다.