본 논문은 음성 장애인인 구어 장애의 자동 탐지 및 중증도 평가를 위한 새로운 접근 방식을 제시합니다. 기존 연구가 주로 음성 모달리티에 집중한 것과 달리, 본 연구는 음성 및 텍스트 모달리티를 모두 활용합니다. 교차 어텐션 메커니즘을 사용하여 음성 및 텍스트 표현 간의 음향 및 언어적 유사성을 학습하고, 다양한 중증도 수준에서의 발음 편차를 평가하여 구어 장애 탐지 및 중증도 평가의 정확도를 향상시킵니다. UA-Speech 구어 장애 데이터베이스를 사용하여 실험을 수행한 결과, 화자 의존 및 독립 설정, 미등장 및 등장 단어 설정에서 각각 99.53%, 93.20%의 탐지 정확도와 98.12%, 51.97%의 중증도 평가 정확도를 달성했습니다. 텍스트 정보 통합을 통해 참조 언어 지식을 제공하여 더욱 강력한 구어 장애 탐지 및 평가 프레임워크를 개발하여 효과적인 진단으로 이어질 수 있음을 시사합니다.