본 연구는 호흡기 음성 신호를 사용하여 폐 질환을 자동으로 탐지하는 설명 가능한 멀티모달 딥러닝 프레임워크를 제시한다. 제안된 시스템은 CNN-BiLSTM Attention 아키텍처 기반의 스펙트럼-시간적 인코더와 MFCC, 스펙트럼 중심, 스펙트럼 대역폭, 영교차율과 같은 생리학적으로 의미 있는 특징을 포착하는 수작업 음향 특징 인코더를 통합한다. 두 분기는 후기 융합을 통해 결합되어 데이터 기반 학습과 도메인 정보를 활용한다. Asthma Detection Dataset Version 2에서 91.21%의 정확도, 0.899의 매크로 F1 점수, 0.9866의 매크로 ROC-AUC를 달성하여 우수한 성능을 보였다. Grad-CAM, Integrated Gradients, SHAP을 사용하여 임상적 투명성을 구축하기 위해 해석 가능한 설명을 생성했다.