본 논문은 "왜 회귀하는가" 원리에 영감을 받아 모델과 설명자 간의 상호 작용의 안정성을 재귀적으로 평가하는 고정점 설명이라는 형식적 개념을 제시한다. 고정점 설명은 최소성, 안정성, 충실도와 같은 속성을 만족하며, 숨겨진 모델 동작과 설명의 약점을 드러낸다. 본 논문은 특징 기반 설명자에서 Sparse AutoEncoders와 같은 기계적 도구에 이르기까지 다양한 설명자 클래스에 대한 수렴 조건을 정의하고, Llama-3.3-70B와 같은 LLM을 포함한 여러 데이터 세트 및 모델에 대한 정량적 및 질적 결과를 보고한다.