본 논문은 합성 이미지 검색(CIR) 분야에 대한 최초의 종합적인 검토 논문이다. CIR은 참조 이미지와 원하는 수정 사항을 명시하는 텍스트를 포함하는 다중 모달 질의를 사용하여 대상 이미지를 검색하는 신흥 과제이다. 본 논문은 ACM TOIS, SIGIR, CVPR 등 주요 학회 및 저널의 120편 이상의 논문을 종합하여 CIR의 다양한 측면을 분석한다. 특히, 기존의 지도 학습 기반 CIR과 제로샷 CIR 모델을 세분화된 분류 체계를 사용하여 체계적으로 분류하고, 속성 기반 CIR 및 대화형 CIR과 같은 관련 작업에 대한 접근 방식도 간략하게 논의한다. 또한, 평가를 위한 벤치마크 데이터셋을 요약하고, 여러 데이터셋에 걸쳐 실험 결과를 비교하여 기존의 지도 학습 및 제로샷 CIR 방법을 분석한다. 마지막으로, 이 분야의 유망한 미래 방향을 제시하고 추가적인 탐구에 관심 있는 연구자들에게 실질적인 통찰력을 제공한다. 관련 연구 목록은 https://github.com/haokunwen/Awesome-Composed-Image-Retrieval 에서 지속적으로 업데이트된다.
시사점: CIR 분야에 대한 최초의 종합적인 검토를 제공하여 연구자들에게 체계적인 이해를 제공한다. 지도 학습 기반 CIR과 제로샷 CIR 모델을 체계적으로 분류하고, 관련 작업 및 벤치마크 데이터셋을 분석하여 연구 방향을 제시한다. GitHub 저장소를 통해 관련 연구 목록을 지속적으로 업데이트하여 연구 커뮤니티에 기여한다.
•
한계점: 본 논문은 2025년 2월까지 출판된 논문을 기반으로 작성되었으므로, 그 이후 발표된 연구는 포함하지 않는다. 또한, 모든 CIR 관련 연구를 완벽하게 포괄하지 못할 가능성이 존재한다.