본 논문은 심층 신경망(DNN), 특히 비전 모델의 디버깅 과정의 어려움을 해결하기 위해 비전-언어 모델(VLM)을 활용한 새로운 접근 방식을 제시합니다. CLIP과 같은 VLM을 이용하여 DNN의 불투명한 표현 공간을 자연어로 해석함으로써, 값비싼 수동 주석 없이 모델 동작에 대한 의미론적 분석을 가능하게 합니다. 핵심 개념인 의미론적 히트맵은 DNN의 통계적 특성을 VLM으로 발견된 개념으로 요약하여 오프라인으로 계산됩니다. 이 히트맵을 활용하여 비전 모델의 오류 국재화, 네트워크 내 오류 위치(엔코더 대 헤드), 그리고 책임있는 고차원 개념을 강조하는 데 활용합니다. 또한, 정상 및 비정상 DNN 동작 간의 의미론적 차이를 요약하는 차등 히트맵을 제시합니다. 마지막으로, 새로운 입력에 대한 히트맵과 사전에 계산된 정상/비정상 DNN 동작 히트맵 간의 유사성을 측정하여 실시간으로 결함을 감지하고 필터링하는 경량화된 실시간 분석 기법을 제안합니다. 분류 오류 및 적대적 공격에 대한 취약성과 같은 두 가지 유형의 결함을 고려하며, ResNet 기반 분류기와 RIVAL10 데이터셋을 사용한 사례 연구를 통해 방법의 유용성을 보여줍니다.