본 논문은 비전 모델의 내부 추론을 이해하기 쉬운 개념으로 변환하는 사후적, 비지도 개념 기반 설명 방법(U-CBEMs)의 충실성 문제를 다룬다. 기존 U-CBEMs의 개념이 모델의 예측을 재현하지 못하는 경우가 많다는 것을 발견하고, 이를 평가하는 통일된 프레임워크와 새로운 충실성 지표인 SURF(Surrogate Faithfulness)를 제시한다. SURF는 설명과 모델 출력을 매핑하는 대리 모델의 예측 손실을 통해 충실성을 정량화한다. 다양한 작업과 아키텍처에 걸쳐 최초의 포괄적인 U-CBEM 충실성 벤치마크를 제공하며, SURF가 기존 지표보다 우수함을 입증한다. 또한, SURF를 통해 U-CBEM의 개념 수, 적대적 공격에 대한 견고성 등을 분석하여 신뢰할 수 있는 충실성 지표로서의 가치를 강조한다.