본 논문은 심층 신경망의 의사결정 과정에 대한 의미론적 설명을 생성하는 데 유망한 도구인 사후 비지도 개념 기반 설명 방법(U-CBEMs)의 신뢰성 평가 및 개선에 초점을 맞추고 있습니다. 기존의 신뢰성 측정 지표의 한계, 특히 개념의 공간적 분포를 무시하는 점을 지적하며, 공간 인식 서로게이트와 두 가지 새로운 신뢰성 측정 지표를 도입한 서로게이트 신뢰성(SF) 평가 방법을 제안합니다. SF를 사용하여 신뢰성을 극대화하는 최적 신뢰(OF) 설명을 생성하며, 실험을 통해 공간 인식의 추가가 모든 경우에 신뢰성을 높이고, OF가 기존 U-CBEM보다 훨씬 더 신뢰할 수 있는 설명을 생성하며(오류 30% 이상 감소), OF의 학습된 개념이 도메인 외 데이터에 대해 잘 일반화되고 적대적 예시에 더 강건하다는 것을 보여줍니다.