Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Spanning Tree Autoregressive Visual Generation

Created by
  • Haebom
Category
Empty

저자

Sangkyu Lee, Changho Lee, Janghoon Han, Hosung Song, Tackgeun You, Hwasup Lim, Stanley Jungkyu Choi, Honglak Lee, Youngjae Yu

개요

Spanning Tree Autoregressive (STAR) 모델은 이미지의 중심 편향 및 지역성과 같은 사전 지식을 통합하여 샘플링 성능을 유지하면서 추론 시 이미지 편집을 수용할 수 있는 유연한 시퀀스 순서를 제공합니다. STAR은 이미지 패치의 위치에 의해 정의된 격자에서 샘플링된 균일한 스패닝 트리의 순회를 사용합니다. 너비 우선 탐색을 통해 순회를 얻어, 거부 샘플링을 통해 이미지의 연결된 부분 관측치가 시퀀스에서 접두사로 나타나도록 합니다. 무작위 순열에 비해 맞춤형 구조화된 무작위 전략을 통해 STAR은 언어 AR 모델링에서 널리 채택된 모델 아키텍처에 큰 변화 없이 후위 완성을 유지하면서 샘플링 성능을 유지합니다.

시사점, 한계점

시사점:
중심 편향 및 지역성과 같은 이미지 사전 지식을 통합하여 샘플링 성능 향상
추론 시 이미지 편집을 위한 유연한 시퀀스 순서 제공
언어 AR 모델링과 유사한 모델 아키텍처 사용
한계점:
구체적인 한계점은 논문 요약에서 명시적으로 언급되지 않음
👍