Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Inference-Time Scaling of Diffusion Models for Infrared Data Generation

Created by
  • Haebom
Category
Empty

저자

Kai A. Horstmann, Maxim Clouser, Kia Khezeli

개요

본 논문은 적외선 영상 생성의 어려움을 해결하기 위해, 적외선 도메인에 특화된 CLIP 기반 검증기를 활용한 추론 시간 스케일링 기법을 제안한다. 적외선 영상 데이터 부족 문제를 해결하고자, FLUX.1-dev 모델을 소량의 적외선 데이터로 파인튜닝하고, 훈련된 검증기를 추론 과정에 적용하여 생성된 적외선 영상의 품질을 향상시킨다. KAIST 데이터셋에서 FID 점수를 10% 감소시키는 등, 제안된 방법론이 저데이터 환경에서 효과적인 성능 향상을 보임을 입증한다.

시사점, 한계점

시사점:
저데이터 환경에서도 추론 시간 검증기를 통해 적외선 영상 생성 품질을 향상시킬 수 있음을 보여줌.
적외선 영상 분야에서 딥러닝 모델 개발을 가속화할 수 있는 잠재력을 제시함.
CLIP 기반 검증기를 활용한 접근 방식이 다양한 도메인에 적용될 수 있는 가능성을 보여줌.
한계점:
실험에 사용된 데이터셋이 특정(KAIST) 데이터셋에 국한됨.
다른 데이터셋 및 모델에 대한 일반화 성능 검증이 필요함.
검증기의 성능 및 개선 방안에 대한 추가 연구가 필요함.
👍