RegionE: Adaptive Region-Aware Generation for Efficient Image Editing
Created by
Haebom
Category
Empty
저자
Pengtao Chen, Xianfang Zeng, Maosen Zhao, Mingzhu Shen, Peng Ye, Bangyin Xiang, Zhibo Wang, Wei Cheng, Gang Yu, Tao Chen
개요
본 논문은 지시 기반 이미지 편집(IIE) 작업의 효율성을 개선하기 위해 제안된 RegionE 프레임워크에 대해 설명합니다. RegionE는 이미지 내 편집 영역과 비편집 영역의 특성 차이에 주목하여, 비편집 영역은 단일 단계 예측으로, 편집 영역은 지역적 반복 디노이징을 수행합니다. 이를 통해 계산 비용을 절감하고, Region-Instruction KV Cache와 Adaptive Velocity Decay Cache를 활용하여 효율성과 품질을 향상시킵니다. Step1X-Edit, FLUX.1 Kontext, Qwen-Image-Edit 등 최신 IIE 모델에 적용하여 가속 효과를 입증했으며, GPT-4o를 이용한 평가에서 의미론적 및 지각적 충실도가 유지됨을 확인했습니다.
시사점, 한계점
•
시사점:
◦
IIE 작업에서 이미지 내 영역별 특성을 고려한 적응형 생성 방식을 제시하여 계산 효율성을 높임.
◦
추가적인 학습 없이 기존 IIE 모델에 적용 가능하며, 가속 효과를 얻음.
◦
Region-Instruction KV Cache 및 Adaptive Velocity Decay Cache와 같은 기술을 통해 지역적 반복 디노이징의 효율성과 품질을 향상시킴.