Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

High Quality Diffusion Distillation on a Single GPU with Relative and Absolute Position Matching

Created by
  • Haebom

저자

Guoqiang Zhang, Kenta Niwa, J. P. Lewis, Cedric Mesnage, W. Bastiaan Kleijn

개요

본 논문은 단일 GPU에서 효율적으로 훈련 가능한 고품질 이미지 생성을 위한 확산 증류 방법인 상대 및 절대 위치 매칭(RAPM)을 제안합니다. 기존의 고해상도 텍스트-이미지 생성 방법인 PCM이나 DMD2는 다수의 GPU와 큰 배치 크기를 필요로 하지만, RAPM은 배치 크기 1로 단일 GPU 훈련을 가능하게 합니다. RAPM은 교사 모델의 샘플링 경로를 상대 및 절대 위치를 매칭하여 모방하려고 시도하며, 상대 위치의 설계는 PCM에서 영감을 받았습니다. 상대 위치와 절대 위치 매칭을 위해 각각 두 개의 판별기를 사용합니다. Stable Diffusion V1.5와 SDXL 실험 결과, RAPM은 제한된 계산 자원 하에서 4개의 타임스텝으로 최고 성능의 1개 타임스텝 방법과 유사한 FID 점수를 생성하는 것을 보여줍니다.

시사점, 한계점

시사점:
단일 GPU를 사용하여 고품질 이미지 생성을 위한 확산 증류 훈련이 가능해짐으로써, 계산 자원이 제한적인 연구자들에게 접근성을 높였습니다.
제한된 계산 자원 하에서 기존 최고 성능 방법과 유사한 결과를 달성했습니다.
상대 및 절대 위치 매칭이라는 새로운 접근 방식을 제시했습니다.
한계점:
아직 제한된 실험 결과만 제시되었으며, 더 다양한 모델과 데이터셋에 대한 실험이 필요합니다.
4개의 타임스텝을 사용하여 최고 성능 방법과 비교했는데, 타임스텝 수가 증가함에 따라 성능 변화에 대한 분석이 부족합니다.
단일 GPU 환경에서의 성능이 다중 GPU 환경과 비교하여 얼마나 효율적인지에 대한 정량적 분석이 부족합니다.
👍