소셜 미디어 텍스트로부터 정신 건강 장애를 조기에 감지하는 것은 시기적절한 지원, 위험 평가, 적절한 자원 연계에 매우 중요합니다. 본 연구는 스트레스, 불안, 우울증, 외상 후 스트레스 장애(PTSD), 자살 생각, 중립적 담론을 포함한 일반적인 정신 건강 상태의 다중 클래스 분류를 위해 설계된 fine-tuned RoBERTa 모델인 multiMentalRoBERTa를 소개합니다. 여러 큐레이션된 데이터 세트를 기반으로 데이터 탐색을 수행하여 클래스 중첩을 분석한 결과, 우울증과 자살 생각, 불안과 PTSD 사이에 강한 상관관계가 나타났으며, 스트레스는 광범위하게 중첩되는 범주로 나타났습니다. 기존의 머신러닝 방법, 도메인별 변환기, 프롬프트 기반 대규모 언어 모델과의 비교 실험을 통해 multiMentalRoBERTa가 우수한 성능을 달성했으며, 6개 클래스 설정에서 매크로 F1 점수 0.839, 스트레스를 제외한 5개 클래스 설정에서 0.870을 기록하여 fine-tuned MentalBERT 및 기본 분류기를 능가했습니다. 예측 정확도 외에도, Layer Integrated Gradients 및 KeyBERT를 포함한 설명 가능성 방법을 적용하여 분류를 유도하는 어휘 단서를 식별했으며, 특히 우울증과 자살 생각을 구별하는 데 중점을 두었습니다. 본 연구 결과는 민감한 맥락에서 신뢰할 수 있고 해석 가능한 감지를 위한 fine-tuned 변환기의 효과를 강조하는 동시에 공정성, 편향 완화, human-in-the-loop 안전 프로토콜의 중요성을 강조합니다. 전반적으로 multiMentalRoBERTa는 정신 건강 플랫폼에서 지원을 강화하기 위한 경량화되고 강력하며 배포 가능한 솔루션으로 제시됩니다.