본 논문은 인간의 시각 시스템의 계층적 구조를 명시적으로 모델링하는 새로운 하드 어텐션 프레임워크인 다중 수준 순환 어텐션 모델(MRAM)을 제안합니다. 기존의 RAM 및 DRAM과 같은 모델은 인간 시각 시스템의 계층 구조를 모델링하지 못하여 시각 탐색 역동성에 대한 타협을 보였고, 과도한 고정 또는 과도한 급속 안구 운동을 생성하는 경향이 있었습니다. MRAM은 두 개의 순환 계층에서 엿보기 위치 생성 및 작업 실행 기능을 분리함으로써 고정과 급속 안구 운동 간의 균형 잡힌 행동을 생성합니다. 실험 결과, MRAM은 인간과 유사한 어텐션 역동성을 달성할 뿐만 아니라 표준 이미지 분류 벤치마크에서 CNN, RAM 및 DRAM 기준 모델보다 일관되게 우수한 성능을 보였습니다.