ART for Diffusion Sampling: A Reinforcement Learning Approach to Timestep Schedule

작성자

Haebom

카테고리

Empty

저자

Yilie Huang, Wenpin Tang, Xunyu Zhou

💡 개요

본 논문은 확산 모델의 샘플 생성 과정에서 시간 이산화 문제의 비효율성을 해결하기 위해 'Adaptive Reparameterized Time (ART)'라는 새로운 방법을 제안합니다. ART는 재매개변수화된 시간 변수의 속도를 조절하여 샘플링 궤적에 따른 계산량을 재분배함으로써 누적 오차를 최소화하는 것을 목표로 합니다. 이를 강화학습 문제로 확장한 ART-RL은 오프라인 학습 후에도 다양한 데이터셋에서 추가 추론 비용 없이 성능 향상을 보여줍니다.

🔑 시사점 및 한계

•

확산 모델 샘플링 시 시간 단계별 계산량 배분을 최적화하여 효율성을 크게 향상시킬 수 있습니다.

•

제안된 ART-RL 방법은 학습된 결정론적 시간 스케줄을 다른 모델에 재사용할 수 있어 범용성을 확보했습니다.

•

강화학습을 통한 시간 스케줄 최적화는 계산량이 많고, 실제 적용 시에는 더 넓은 범위의 모델 아키텍처와 데이터셋에 대한 일반화 성능 검증이 필요합니다.

PDF 보기

Made with Slashpage