기존 이미지 정렬 방법들은 특징이 부족한 영역, 극단적인 크기 및 시야 차이, 그리고 큰 변형이 있는 경우에 어려움을 겪어 최적이 아닌 정확도를 초래하는 경우가 많습니다. 본 논문에서는 다중 스케일 이미지 표현에서 중요 영역에 집중하면서 변환 필드를 반복적으로 개선함으로써 이러한 과제에 대한 강건성을 향상시키는 새로운 방법인 Auto-Regressive Transformation (ART)을 제안합니다. ART는 계층적 다중 스케일 특징을 활용하여 각 스케일에서 무작위로 샘플링된 점을 사용하여 변환을 개선하는 자동 회귀 프레임워크 내에서 조잡한 것부터 미세한 것까지의 변환을 반복적으로 추정합니다. 크로스 어텐션 레이어의 안내를 통합함으로써 모델은 중요 영역에 집중하여 특징이 제한적인 어려운 조건에서도 정확한 정렬을 보장합니다. 다양한 데이터 세트에 대한 광범위한 실험을 통해 ART가 최첨단 방법보다 훨씬 뛰어나다는 것을 보여주어 광범위한 적용 가능성을 가진 정밀한 이미지 정렬을 위한 강력한 새로운 방법임을 입증합니다.