본 논문은 심층 학습 모델의 복잡성 증가에 따라 모델에 독립적인 해석 가능성을 확보하는 것이 중요해짐을 강조하며, 사후적 개념적 대조 편집을 이용하여 검색 모델 표현에 각인된 주목할 만한 패턴과 편향을 드러내는 방법을 제시합니다. 다양한 품사를 표적으로 하는 최적이고 제어 가능한 대조적 개입을 체계적으로 설계하여 흑상자 방식으로 언어적 및 시각 언어적 사전 훈련 모델을 효과적으로 설명합니다. 또한, 대조적 개입이 모델 결과에 미치는 단어별 영향을 평가하는 새로운 지표를 제시하여 각 개입의 효과를 종합적으로 평가합니다.