Sign In

Nested AutoRegressive Models

Created by
  • Haebom
Category
Empty

저자

Hongyu Wu, Xuhui Fan, Zhangkai Wu, Longbing Cao

개요

자기 회귀(AutoRegressive, AR) 모델은 이미지 생성 분야에서 경쟁력 있는 성능을 보여주었지만, 토큰 단위의 생성 방식 때문에 계산 비용이 많이 든다. 본 논문에서는 Nested AutoRegressive (NestAR) 모델을 제안하여 이미지 생성에 중첩된 AR 아키텍처를 적용한다. NestAR은 다중 스케일 모듈을 계층적 순서로 설계하며, 더 큰 스케일의 모듈이 이전 작은 스케일 모듈의 출력에 조건부로 생성된다. 각 모듈 내에서 NestAR은 또 다른 AR 구조를 사용하여 토큰 "패치"를 생성한다. 제안된 중첩 AR 아키텍처는 n개의 이미지 토큰을 생성하는 데 필요한 전체 복잡성을 O(n)에서 O(log n)으로 줄이고, 이미지 다양성을 증가시킨다. NestAR은 또한 연속 토큰을 사용하기 위해 flow matching loss를 통합하고, 모델 훈련에서 이러한 다중 스케일 모듈을 조율하는 목표를 개발한다. NestAR은 경쟁력 있는 이미지 생성 성능을 달성하면서 계산 비용을 크게 절감한다.

시사점, 한계점

시사점:
중첩된 AR 아키텍처를 사용하여 이미지 생성 과정의 계산 복잡성을 감소시킴.
이미지 생성 속도 향상과 함께 이미지 다양성 증가.
flow matching loss와 다중 스케일 모듈 조율을 통해 모델 성능 개선.
한계점:
구체적인 성능 지표(예: FID, IS) 및 기존 모델과의 비교가 논문에 명시되지 않음.
모델 아키텍처 및 학습 과정에 대한 자세한 설명 부족.
다양한 이미지 데이터셋에 대한 일반화 성능 평가 부재.
👍