A Comprehensive Survey on Composed Image Retrieval

작성자

Haebom

카테고리

비어 있음

저자

Xuemeng Song, Haoqiang Lin, Haokun Wen, Bohan Hou, Mingzhu Xu, Liqiang Nie

개요

본 논문은 구성 이미지 검색(CIR) 분야에 대한 종합적인 검토를 제공합니다. CIR은 참조 이미지와 사용자가 원하는 변경 사항을 명시하는 수정 텍스트로 구성된 다중 모드 쿼리를 사용하여 대상 이미지를 검색할 수 있게 하는 새로운 과제입니다. 본 논문은 ACM TOIS, SIGIR, CVPR 등 최고 수준의 학회 및 저널에 발표된 120편 이상의 논문에서 얻은 통찰력을 종합하여, 지도 학습 기반 CIR 및 제로샷 CIR 모델을 세분화된 분류 체계를 사용하여 체계적으로 분류합니다. 속성 기반 CIR 및 대화형 CIR과 같은 CIR과 밀접하게 관련된 작업에 대한 접근 방식도 간략하게 논의하고, 평가를 위한 벤치마크 데이터셋을 요약하며, 여러 데이터셋에 걸쳐 실험 결과를 비교하여 기존의 지도 학습 기반 및 제로샷 CIR 방법을 분석합니다. 마지막으로, 이 분야의 유망한 미래 방향을 제시하고, 추가 탐구에 관심 있는 연구자들을 위한 실용적인 통찰력을 제공합니다.