본 논문은 기존 확산 모델이 고해상도 이미지 생성 시 성능 저하를 보이는 문제를 해결하기 위해, 학습 없이 고해상도 이미지 생성을 가능하게 하는 효율적이고 간단한 방법인 RectifiedHR을 제안한다. 핵심 아이디어는 '잡음 갱신(noise refresh)' 전략과 '에너지 수정(Energy Rectification)' 전략으로, 잡음 갱신 전략은 몇 줄의 코드만으로 고해상도 생성 능력을 향상시키고, 에너지 수정 전략은 고해상도 생성 과정에서 발생하는 이미지 흐릿함(에너지 감소 현상)을 해결하기 위해 분류기 없는 안내(classifier-free guidance)의 하이퍼파라미터를 수정한다. RectifiedHR은 완전히 학습이 필요 없으며 구현이 간단하면서도 기존 방법들보다 우수한 효율성과 효과를 보인다.
시사점, 한계점
•
시사점:
◦
학습 없이 고해상도 이미지 생성을 가능하게 하는 효율적인 방법을 제시하였다.
◦
간단한 코드 수정만으로 성능 향상을 달성할 수 있음을 보여주었다.
◦
고해상도 이미지 생성 과정에서 발생하는 에너지 감소 현상을 규명하고 해결 방안을 제시하였다.