Bayesian Optimization for Controlled Image Editing via LLMs
Created by
Haebom
Category
Empty
저자
Chengkun Cai, Haoliang Liu, Xu Zhao, Zhongyu Jiang, Tianfang Zhang, Zongkai Wu, Jenq-Neng Hwang, Serge Belongie, Lei Li
개요
본 논문은 이미지 생성 분야에서 정확한 콘텐츠 제어 및 의미적 일관성 유지를 위한 새로운 방법인 BayesGenie를 제안합니다. BayesGenie는 대규모 언어 모델(LLM)과 베이지안 최적화를 통합하여 사용자가 자연어 설명만으로 이미지를 수정할 수 있도록 합니다. 수동 영역 표시가 필요 없으며, 모델 재학습 없이 다양한 LLM에 적용 가능한 모델 독립적인 설계를 채택했습니다. 베이지안 최적화 전략을 통해 추론 과정 매개변수를 자동으로 개선하여 높은 정확도의 이미지 편집을 가능하게 합니다. Claude3 및 GPT-4를 포함한 다양한 LLM을 사용한 실험을 통해 기존 방법보다 편집 정확도와 의미 보존 측면에서 우수한 성능을 보임을 입증했습니다.