자기 회귀(AutoRegressive, AR) 모델은 이미지 생성 분야에서 경쟁력 있는 성능을 보여주었지만, 토큰 단위의 생성 방식 때문에 계산 비용이 많이 든다. 본 논문에서는 Nested AutoRegressive (NestAR) 모델을 제안하여 이미지 생성에 중첩된 AR 아키텍처를 적용한다. NestAR은 다중 스케일 모듈을 계층적 순서로 설계하며, 더 큰 스케일의 모듈이 이전 작은 스케일 모듈의 출력에 조건부로 생성된다. 각 모듈 내에서 NestAR은 또 다른 AR 구조를 사용하여 토큰 "패치"를 생성한다. 제안된 중첩 AR 아키텍처는 n개의 이미지 토큰을 생성하는 데 필요한 전체 복잡성을 O(n)에서 O(log n)으로 줄이고, 이미지 다양성을 증가시킨다. NestAR은 또한 연속 토큰을 사용하기 위해 flow matching loss를 통합하고, 모델 훈련에서 이러한 다중 스케일 모듈을 조율하는 목표를 개발한다. NestAR은 경쟁력 있는 이미지 생성 성능을 달성하면서 계산 비용을 크게 절감한다.