제한된 규모의 소형 언어 모델(SLM)은 심층적인 사회적 추론 능력이 부족하여 Theory-of-Mind(ToM) 과제 수행에 어려움을 겪습니다. 본 연구는 ToM 추론을 향상시키기 위해 아키텍처 변경이 아닌 추론 시간 확장을 활용하는 DEL-ToM 프레임워크를 제안합니다. 동적 인식 논리(DEL)에 기반한 일련의 신념 업데이트로 ToM 과제를 분해하여 구조적이고 투명한 추론을 가능하게 합니다. DEL 시뮬레이터를 통해 자동으로 생성된 레이블을 사용하여 각 신념 업데이트 단계의 점수를 매기는 검증자(Process Belief Model, PBM)를 훈련합니다. 추론 중에 언어 모델이 생성한 후보 신념 추적을 PBM으로 평가하고, 점수가 가장 높은 추적을 선택합니다. 이를 통해 SLM은 테스트 시 추가적인 계산을 할당하여 더욱 신중한 추론을 모방할 수 있습니다. 다양한 모델 규모와 벤치마크에 대한 실험 결과, DEL-ToM은 성능을 일관되게 향상시켜 재훈련 없이 검증 가능한 신념 감독이 SLM의 ToM 능력을 크게 향상시킬 수 있음을 보여줍니다.