Huginn-3.5B, depth-recurrent Transformer 모델이 해석 가능한 잠재적 CoT (Chain-of-thought) 추론 구조를 나타내는지 조사한다. Logit Lens 및 Coda Lens를 포함한 다양한 프로빙 기술을 사용하여 산술 작업에 대한 모델의 내부 동작을 검사한다. 최종 및 중간 결과 토큰의 랭크 궤적을 추적하여 해석 가능한 잠재 CoT의 증거가 제한적임을 발견한다. 또한, 재귀 블록 간에 상당한 프로빙 불일치가 있으며, 은닉 상태의 해석 가능성은 레이어 인덱스와 디코딩 방법에 따라 크게 달라짐을 확인한다. 재귀 깊이 증가가 미미한 이점만 가져다주고, 명시적으로 추론 단계를 외부화하는 모델에 미치지 못함을 경험적으로 보여준다.