Masked auto-regressive diffusion models (MAR)의 느린 추론 속도 문제를 해결하기 위해, 확산 체인을 단일 AR 생성 단계로 압축하는 MARVAL (Masked Auto-regressive Variational Acceleration) 프레임워크를 제안합니다. MARVAL은 추론 속도를 향상시킬 뿐만 아니라 강화 학습 (RL) 후 훈련을 가능하게 하여 확장 가능하고 사용자 선호도가 높은 생성 모델을 만듭니다. 주요 기여는 다음과 같습니다. (1) 샘플 품질 저하 없이 masked auto-regressive diffusion models을 단일 생성 단계로 증류하기 위한 새로운 점수 기반 변동 목적 함수, (2) MARVAL-RL을 통한 masked auto-regressive 모델을 위한 효율적인 RL 프레임워크. ImageNet 256*256에서 MARVAL-Huge는 MAR-diffusion에 비해 30배 이상의 속도 향상과 함께 FID 2.00을 달성했으며, MARVAL-RL은 ImageNet 데이터셋에서 CLIP 및 이미지 보상 점수에서 일관된 개선을 보였습니다.