본 논문은 심층 신경망의 내부 표현을 해석하기 위한 새로운 방법으로, 공간적으로 해석된 특징 맵을 조건으로 하는 사전 훈련된 고충실도 확산 모델을 이용하여 특징 공간에서 입력 공간으로의 매핑을 확률적으로 학습하는 방법을 제안합니다. CNN과 ViT 등 다양한 사전 훈련된 이미지 분류기에서 우수한 재구성 성능을 보이며, 특징 공간의 이해를 향상시키는 데 잠재력을 가지고 있음을 보여줍니다. 정성적 비교 및 강건성 분석을 통해 방법의 타당성을 검증하고, 입력 공간에서 개념 조향의 시각화나 특징 공간의 복합적 특성 조사와 같은 응용 가능성을 제시합니다. 기존의 근사적인 방법들보다 고충실도의 매핑을 제공하여 심층 신경망의 이해를 증진시키는 데 기여합니다.