본 논문은 텍스트-이미지 확산 모델의 제한적인 출력 다양성 문제를 해결하기 위해, 단일 입력 프롬프트로부터 다양한 이미지 세트를 생성하는 새로운 접근 방식인 WANDER를 소개한다. WANDER는 대규모 언어 모델(LLM)을 활용하여 프롬프트의 의미론적 진화를 유도하고, CLIP 임베딩을 통해 참신성을 정량화한다. 또한, 이미지를 다양한 프롬프트 공간으로 유도하기 위해 이미터를 적용하여 생성된 이미지의 다양성을 향상시킨다.
시사점, 한계점
•
시사점:
◦
단일 프롬프트에서 다양한 이미지 세트를 생성하는 새로운 방법론 제시.
◦
대규모 언어 모델(LLM)과 CLIP 임베딩을 활용하여 참신성을 측정하고 프롬프트를 진화시킴.