Sign In

Editable Noise Map Inversion: Encoding Target-image into Noise For High-Fidelity Image Manipulation

Created by
  • Haebom
Category
Empty

저자

Mingyu Kang, Yong Suk Choi

개요

본 논문은 텍스트-이미지 확산 모델의 이미지 편집 능력을 향상시키기 위해, 소스 이미지를 편집 가능한 노이즈 맵으로 변환하는 새로운 기법인 ENM Inversion을 제안한다. 기존의 인버전 방식이 텍스트 프롬프트에 대한 정확성을 확보하는 데 어려움이 있다는 문제점을 해결하고자, ENM Inversion은 내용 보존과 편집 가능성을 모두 보장하는 최적의 노이즈 맵을 탐색한다. 이 기법은 재구성된 이미지와 편집된 이미지 간의 차이를 최소화하여 원하는 편집을 수행하며, 이미지 및 비디오 편집 작업에서 기존 방식보다 우수한 성능을 보인다.

시사점, 한계점

시사점:
텍스트 프롬프트에 더 충실한 이미지 편집 가능성 제공.
이미지 내용 보존과 편집의 균형을 효과적으로 달성.
다양한 이미지 편집 작업에서 기존 방식 대비 향상된 성능.
비디오 편집에 적용하여 프레임 간의 일관성 유지 및 내용 조작 가능.
한계점:
논문에 구체적인 한계점 언급 없음.
👍