Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model for Vision

Created by
  • Haebom
Category
Empty

저자

Pengcheng Pan, Yonekura Shogo, Yasuo Kuniyoshi

개요

본 논문은 foveal 시각에서 영감을 받아 해석 가능성과 파라미터 경제성을 제공하는 hard attention 모델을 제시한다. 기존의 RAM 및 DRAM 모델이 인간 시각 시스템의 계층 구조를 모델링하는 데 실패하여 시각적 탐색 역학을 저해하는 문제를 해결하기 위해, 본 논문은 MRAM (Multi-Level Recurrent Attention Model)을 제안한다. MRAM은 두 개의 순환 레이어에서 시점 위치 생성과 작업 실행 기능을 분리하여 균형 잡힌 고정 및 단속 운동을 생성하며, 표준 이미지 분류 벤치마크에서 CNN, RAM 및 DRAM보다 우수한 성능을 보인다.

시사점, 한계점

시사점:
인간 시각 처리의 신경 계층 구조를 명시적으로 모델링하는 새로운 hard attention 프레임워크 제안.
균형 잡힌 고정 및 단속 운동을 생성하여 인간과 유사한 주의 역학 달성.
표준 이미지 분류 벤치마크에서 기존 모델 (CNN, RAM, DRAM)보다 우수한 성능.
한계점:
논문에서 구체적인 한계점 언급되지 않음.
👍