Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

NoiseAR: AutoRegressing Initial Noise Prior for Diffusion Models

Created by
  • Haebom

저자

Zeming Li, Xiangyue Liu, Xiangyu Zhang, Ping Tan, Heung-Yeung Shum

개요

본 논문에서는 확산 모델의 초기 잡음(noise)을 생성하는 새로운 방법인 NoiseAR을 제안합니다. 기존의 확산 모델은 등방성 가우시안 분포와 같이 단순하고 고정된 분포에서 초기 잡음을 샘플링하지만, NoiseAR은 자기회귀(Autoregressive) 확률 모델링을 통해 초기 잡음의 사전 분포를 동적으로 그리고 제어 가능하게 학습합니다. 공간 패치 또는 토큰에 대한 자기회귀 모델링을 통해 복잡한 공간적 의존성을 포착하고 초기 상태에 학습된 구조를 도입합니다. 특히, 조건부(conditional)로 설계되어 텍스트 프롬프트를 통해 초기 잡음의 사전 분포를 직접적으로 제어할 수 있으며, 이를 통해 확산 초기화를 미세 조정할 수 있습니다. 실험 결과, NoiseAR은 샘플 품질 향상 및 조건부 입력과의 일관성 향상을 보여주며, 기존의 임의 초기화에 대한 강력한 학습 기반 대안을 제공합니다. 또한 확률적 공식을 통해 Markov Decision Processes 및 강화 학습과 같은 확률적 프레임워크에 원활하게 통합될 수 있다는 장점이 있습니다.

시사점, 한계점

시사점:
확산 모델의 초기 잡음 생성 과정에 대한 새로운 접근 방식 제시: 자기회귀 모델을 이용하여 동적이고 제어 가능한 초기 잡음 사전 분포를 학습
텍스트 프롬프트를 통한 미세 조정 가능한 초기 잡음 생성: 조건부 생성을 통해 입력에 대한 일관성 향상 및 샘플 품질 개선
확률적 프레임워크와의 원활한 통합: Markov Decision Processes 및 강화 학습과 같은 알고리즘과의 호환성 증대
한계점:
본 논문에서 제시된 방법의 성능이 다른 최첨단 확산 모델과 비교 분석되지 않음.
대규모 데이터셋에 대한 성능 평가 및 확장성에 대한 추가적인 연구 필요.
NoiseAR의 계산 비용 및 학습 시간에 대한 자세한 분석 부족.
👍