계층적 추론 모델(HRM)은 복잡한 추론 과제에서 뛰어난 성능을 보이지만, 본 연구는 HRM이 진정으로 추론하는 것인지 아니면 추측하는 것인지에 대한 기계론적 분석을 수행합니다. 분석 결과, HRM은 단순한 퍼즐에서의 실패, 추론 과정에서의 갑작스러운 정확도 향상("grokking" 현상), 그리고 잘못된 고정점에 빠지는 "추측"과 같은 동작을 보이는 것으로 나타났습니다. 이러한 발견을 바탕으로 데이터 증강, 입력 교란, 모델 부트스트래핑을 포함하는 새로운 전략을 제안하며, 이를 통해 Sudoku-Extreme 데이터셋에서 성능을 크게 향상시켰습니다.