본 연구는 SIGLIP과 Gemma-3b 아키텍처를 활용한 비전-언어 모델(VLM)을 통해 자동화된 급성 결핵 선별검사를 수행하는 것을 제시합니다. 흉부 X선 이미지와 임상 기록을 통합하여 특히 자원이 제한된 환경에서 진단 정확도와 효율성을 향상시키는 것을 목표로 합니다. VLM은 흉부 X선의 시각적 데이터와 임상적 맥락을 결합하여 상세하고 맥락을 고려한 진단 보고서를 생성합니다. SIGLIP은 시각적 인코딩에, Gemma-3b는 디코딩에 사용되어 급성 결핵 특이적 병리 및 임상적 통찰력을 효과적으로 표현합니다. 실험 결과, 폐렴, 공동, 결절과 같은 주요 급성 결핵 병변을 높은 정밀도(97%)와 재현율(96%)로 검출했습니다. 강력한 공간 위치 파악 능력과 급성 결핵 양성 환자 구별의 견고성을 보여주어 급성 결핵 진단을 위한 신뢰할 수 있는 도구임을 입증했습니다. VLM의 다중 모드 기능은 방사선 전문의에 대한 의존도를 줄여 급성 결핵 선별 검사를 위한 확장 가능한 솔루션을 제공합니다.