Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SGDFuse: SAM-Guided Diffusion for High-Fidelity Infrared and Visible Image Fusion

Created by
  • Haebom

저자

Xiaoyang Zhang, jinjiang Li, Guodong Fan, Yakun Ju, Linwei Fan, Jun Liu, Alex C. Kot

개요

본 논문은 적외선 및 가시광선 영상 융합(IVIF)에서 기존 방법들의 한계점인 심층적인 의미 이해 부족과 융합 과정에서의 인공물 및 세부 정보 손실 문제를 해결하기 위해, Segment Anything Model (SAM)을 이용한 조건부 확산 모델인 SGDFuse를 제안합니다. SGDFuse는 SAM이 생성한 고품질의 의미론적 마스크를 사전 정보로 활용하여 조건부 확산 모델을 통해 융합 과정을 최적화합니다. 두 단계 과정으로, 먼저 다중 모드 특징의 예비 융합을 수행하고, 이후 SAM의 의미론적 마스크와 예비 융합 이미지를 조건으로 하여 확산 모델의 거친-미세 잡음 제거 생성을 수행합니다. 이를 통해 의미론적 방향성과 고충실도 결과를 동시에 보장합니다. 실험 결과, SGDFuse는 주관적 및 객관적 평가와 후속 작업 적용성 측면에서 최첨단 성능을 달성함을 보여줍니다. 소스 코드는 GitHub에서 공개됩니다.

시사점, 한계점

시사점:
SAM을 활용하여 의미론적으로 정확하고 고품질의 적외선 및 가시광선 영상 융합을 달성하는 새로운 방법 제시.
조건부 확산 모델을 이용하여 융합 과정의 세부 제어 및 고충실도 결과 보장.
주관적 및 객관적 평가, 후속 작업 적용성에서 최첨단 성능 확인.
공개된 소스 코드를 통한 재현성 및 확장성 확보.
한계점:
SAM의 성능에 의존적일 수 있음. SAM의 마스크 생성 오류가 융합 결과에 영향을 미칠 수 있음.
계산 비용이 높을 수 있음. 확산 모델의 특성상 처리 시간이 길어질 가능성 존재.
다양한 환경 및 데이터셋에 대한 일반화 성능 검증 필요.
👍