본 논문은 foveal 시각에서 영감을 받아 해석 가능성과 파라미터 경제성을 제공하는 hard attention 모델을 제시한다. 기존의 RAM 및 DRAM 모델이 인간 시각 시스템의 계층 구조를 모델링하는 데 실패하여 시각적 탐색 역학을 저해하는 문제를 해결하기 위해, 본 논문은 MRAM (Multi-Level Recurrent Attention Model)을 제안한다. MRAM은 두 개의 순환 레이어에서 시점 위치 생성과 작업 실행 기능을 분리하여 균형 잡힌 고정 및 단속 운동을 생성하며, 표준 이미지 분류 벤치마크에서 CNN, RAM 및 DRAM보다 우수한 성능을 보인다.