Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Edge-preserving noise for diffusion models

Created by
  • Haebom

저자

Jente Vandersanden, Sascha Holl, Xingchang Huang, Gurprit Singh

개요

본 논문은 기존 등방성 가우시안 잡음 제거 과정을 사용하는 생성 확산 모델의 한계를 극복하기 위해, 에지(edge)를 고려한 새로운 잡음 스케줄러를 제시합니다. 이를 통해 등방성과 에지 보존 잡음을 혼합하는 하이브리드 잡음 기법을 도입하여, 데이터의 구조적 정보를 더 잘 활용하는 에지 보존 확산 모델을 제안합니다. 본 모델은 저주파수 영역 학습 향상을 통해 형태 및 구조 정보 표현 능력을 높이고, 무조건 이미지 생성 및 형태 기반 사전 정보를 활용한 생성 작업(예: 스트로크-이미지 생성)에서 최첨단 기준 모델들을 상회하는 성능을 보여줍니다. FID 및 CLIP 점수를 통해 최대 30%의 성능 향상을 정량적으로 입증합니다.

시사점, 한계점

시사점:
기존 등방성 확산 모델의 한계를 극복하고, 데이터의 구조적 정보를 효과적으로 활용하는 새로운 에지 보존 확산 모델 제시.
저주파수 영역 학습 향상을 통한 형태 및 구조 정보 표현 능력 향상.
무조건 이미지 생성 및 형태 기반 사전 정보 활용 생성 작업에서 우수한 성능 달성 (최대 30% 성능 향상).
스트로크-이미지 생성과 같은 형태 기반 사전 정보를 활용하는 작업에 특히 강건함.
한계점:
에지 검출 및 잡음 스케줄링 전략의 최적화에 대한 추가 연구 필요.
다양한 데이터셋 및 작업에 대한 일반화 성능 평가 필요.
에지 보존과 등방성 잡음 간의 균형 조절에 대한 추가적인 연구 필요.
👍