Sign In

Evolve to Inspire: Novelty Search for Diverse Image Generation

Created by
  • Haebom
Category
Empty

저자

Alex Inch, Passawis Chaiyapattanaporn, Yuchen Zhu, Yuan Lu, Ting-Wen Ko, Davide Paglieri

개요

본 논문은 텍스트-이미지 확산 모델의 제한적인 출력 다양성 문제를 해결하기 위해, 단일 입력 프롬프트로부터 다양한 이미지 세트를 생성하는 새로운 접근 방식인 WANDER를 소개한다. WANDER는 대규모 언어 모델(LLM)을 활용하여 프롬프트의 의미론적 진화를 유도하고, CLIP 임베딩을 통해 참신성을 정량화한다. 또한, 이미지를 다양한 프롬프트 공간으로 유도하기 위해 이미터를 적용하여 생성된 이미지의 다양성을 향상시킨다.

시사점, 한계점

시사점:
단일 프롬프트에서 다양한 이미지 세트를 생성하는 새로운 방법론 제시.
대규모 언어 모델(LLM)과 CLIP 임베딩을 활용하여 참신성을 측정하고 프롬프트를 진화시킴.
이미터를 사용하여 프롬프트 공간의 다양한 영역을 탐색하여 다양성 증진.
기존 진화적 프롬프트 최적화 기반 기술 대비 우수한 성능 입증.
한계점:
구체적인 한계점은 논문 요약에서 명시되지 않음. (논문의 추가적인 내용을 확인해야 함)
👍