Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction

Created by
  • Haebom

저자

Hrishav Bakul Barua, Kalin Stefanov, Lemuel Lai En Che, Abhinav Dhall, KokSheik Wong, Ganesh Krishnasamy

개요

본 논문은 저조도 동적 범위(LDR) 이미지를 고조도 동적 범위(HDR) 이미지로 변환하는 방법을 제시합니다. 기존의 비학습 기반 방법과 최근의 데이터 기반 방법 모두 단일 노출 및 다중 노출 LDR 이미지를 HDR 이미지 재구성에 활용하는 데 중점을 두고 있지만, 대부분 최첨단 방법은 고품질의 LDR-HDR 쌍 데이터셋을 필요로 합니다. 이 논문에서는 쌍을 이루지 않은 LDR-HDR 데이터셋을 사용하는 LLM-HDR 방법을 제안합니다. LLM-HDR은 대규모 언어 모델(LLM)의 지각 능력을 수정된 의미 및 순환 일관성을 갖춘 적대적 네트워크 구조에 통합하여, 아티팩트 및 노출을 고려한 생성기를 도입하여 시각적 아티팩트 제거 및 의미적 일관성을 해결합니다. LLM-HDR은 자기 지도 학습 설정에서 LDR-HDR 변환 작업에 LLM을 사용한 최초의 방법이며, 여러 벤치마크 데이터셋에서 최첨단 성능을 달성합니다.

시사점, 한계점

시사점:
쌍을 이루지 않은 LDR-HDR 데이터셋을 사용하여 HDR 이미지 변환 문제를 해결하는 새로운 접근 방식을 제시합니다.
LLM을 활용하여 이미지 변환의 의미적 일관성을 향상시켰습니다.
아티팩트 및 노출을 고려한 생성기를 통해 고품질 HDR 이미지를 재구성합니다.
여러 벤치마크 데이터셋에서 최첨단 성능을 달성했습니다.
한계점:
LLM의 활용으로 인한 계산 비용 증가 가능성.
사용된 LLM의 특성에 따라 성능이 영향을 받을 수 있음.
다양한 조명 조건이나 이미지 유형에 대한 일반화 성능에 대한 추가적인 연구가 필요할 수 있음.
👍