Sign In

Diffusion Adaptive Text Embedding for Text-to-Image Diffusion Models

Created by
  • Haebom
Category
Empty

저자

Byeonghu Na, Minsang Park, Gyuwon Sim, Donghyeok Shin, HeeSun Bae, Mina Kang, Se Jung Kwon, Wanmo Kang, Il-Chul Moon

개요

본 논문은 텍스트-이미지 확산 모델의 텍스트 임베딩을 동적으로 업데이트하는 Diffusion Adaptive Text Embedding (DATE)를 제안합니다. DATE는 각 확산 단계에서 중간 단계의 데이터에 기반하여 텍스트 임베딩을 업데이트하여 텍스트와 생성된 이미지 간의 정렬을 향상시킵니다. 추가적인 모델 훈련 없이 확산 샘플링 과정에서 텍스트 조건을 동적으로 조정하며, 다중 개념 생성 및 텍스트 기반 이미지 편집과 같은 다양한 작업에서 고정된 텍스트 임베딩보다 우수한 성능을 보입니다.

시사점, 한계점

시사점:
텍스트-이미지 정렬의 개선: 각 확산 단계에서 텍스트 임베딩을 동적으로 업데이트하여 텍스트와 생성된 이미지 간의 정렬을 향상시킵니다.
추가적인 모델 훈련 불필요: 기존 모델에 추가적인 훈련 없이 적용 가능합니다.
다양한 작업에서의 성능 향상: 다중 개념 생성 및 텍스트 기반 이미지 편집과 같은 다양한 작업에서 향상된 성능을 보입니다.
이론적 분석 및 실험 결과 제시: DATE의 유효성을 뒷받침하는 이론적 분석과 실험 결과를 제공합니다.
코드 공개: 연구의 재현 및 확장을 위한 코드를 공개했습니다.
한계점:
논문 내용에서 한계점에 대한 직접적인 언급은 없음.
👍