심층 비전 모델은 해석하기 어려운 입출력 계산을 수행합니다. 개념 기반 설명 방법(CBEM)은 인간이 이해할 수 있는 의미 단위 또는 개념으로 모델의 일부를 재표현하여 해석 가능성을 높입니다. 파생된 설명이 충실한지(즉, 모델의 내부 계산을 나타내는지) 확인하려면 출력을 계산하기 위해 개념을 결합하는 대리 모델이 필요합니다. 해석 가능성을 위해 이루어진 단순화는 불가피하게 충실도를 감소시켜 둘 사이의 상충 관계를 초래합니다. 최첨단 비지도 CBEM(U-CBEM)은 점점 더 해석 가능한 개념을 보고하는 동시에 모델에 더 충실하다고 보고되었습니다. 그러나 보고된 충실도 개선은 (1) 설명의 해석 가능성에 측정되지 않은 비용을 도입하는 과도하게 복잡한 대리 모델을 사용하거나, (2) 우리가 입증한 바와 같이 충실도를 제대로 측정하지 않는 삭제 기반 접근 방식에 의존하는 것에서 인위적으로 발생함을 관찰했습니다. 우리는 (1) 이전의 복잡한 대리 모델을 설명의 해석 가능성을 변경하지 않고 충실도를 측정하는 간단한 선형 대리 모델로 대체하고, (2) 예측된 클래스뿐만 아니라 모든 출력 클래스에서 손실을 평가하는 잘 정립된 메트릭을 도입하는 Surrogate Faithfulness (SURF)를 제안합니다. 우리는 간단한 건전성 검사(무작위 개념이 있는 설명은 덜 충실해야 함)를 제안하여 SURF를 검증합니다. 이전의 대리 모델은 이를 실패했습니다. SURF는 U-CBEM의 첫 번째 신뢰할 수 있는 충실도 벤치마킹을 가능하게 하며, 시각적으로 매력적인 많은 U-CBEM이 충실하지 않다는 것을 밝혀냅니다. 코드는 공개될 예정입니다.