본 논문은 루프 트랜스포머(Looped-Attn)가 표준 트랜스포머(Single-Attn)보다 복잡한 추론 작업에서 우수한 성능을 보이는 현상을 로스 랜드스케이프 기하학 관점에서 설명한다. 특히, 샘플 및 헤시안 수준에서의 동적 차이를 관찰하여, Looped-Attn의 재귀적 구조가 River-V-Valley로의 랜드스케이프 유도 편향을 유발한다는 가설을 제시한다. 이를 통해 Looped-Attn이 더 나은 손실 수렴과 복잡한 패턴 학습을 가능하게 함을 이론적으로 증명한다. 또한, 이러한 통찰력을 바탕으로 Looped-Attn의 훈련 과정을 가속화하는 SHIFT (Staged HIerarchical Framework for Progressive Training)를 제안한다.