Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OT-ALD: Aligning Latent Distributions with Optimal Transport for Accelerated Image-to-Image Translation

Created by
  • Haebom
Category
Empty

저자

Zhanpeng Wang, Shuting Cao, Yuhang Lu, Yuhan Li, Na Lei, Zhongxuan Luo

개요

본 논문은 Cycle consistency를 유지하면서 유연성을 갖는 이미지-투-이미지 (I2I) 변환 방법인 Dual Diffusion Implicit Bridge (DDIB)의 단점인 낮은 변환 효율성과 잠재 분포 불일치로 인한 변환 궤적 편차 문제를 해결하기 위해, 최적 수송 (OT) 이론에 기반한 새로운 I2I 변환 프레임워크 OT-ALD를 제안한다. OT-ALD는 소스 도메인의 잠재 분포에서 대상 도메인의 잠재 분포로의 OT 맵을 계산하고, 매핑된 분포를 대상 도메인에서 역확산 과정을 시작하는 지점으로 사용하여 문제를 해결한다. 실험 결과, OT-ALD는 최고 성능의 기반 모델에 비해 샘플링 효율을 20.29% 향상시키고, FID 점수를 평균 2.6 감소시켰다.

시사점, 한계점

시사점:
DDIB 기반 방법의 장점을 유지하면서 변환 효율성 및 이미지 품질을 향상시킴.
최적 수송 이론을 이미지 변환 문제에 효과적으로 적용.
여러 고해상도 데이터셋에 대한 실험을 통해 성능 우수성을 입증.
한계점:
구체적인 OT 맵 계산 방법 및 구현 세부 사항에 대한 설명 부족 가능성.
다른 I2I 변환 방법과의 비교 및 분석 부족 가능성.
일반화 성능에 대한 추가적인 연구 필요.
👍