로그인

A Comprehensive Survey on Composed Image Retrieval

작성자
  • Haebom
카테고리
비어 있음

저자

Xuemeng Song, Haoqiang Lin, Haokun Wen, Bohan Hou, Mingzhu Xu, Liqiang Nie

개요

본 논문은 구성 이미지 검색(CIR) 분야에 대한 종합적인 검토를 제공합니다. CIR은 참조 이미지와 사용자가 원하는 변경 사항을 명시하는 수정 텍스트로 구성된 다중 모드 쿼리를 사용하여 대상 이미지를 검색할 수 있게 하는 새로운 과제입니다. 본 논문은 ACM TOIS, SIGIR, CVPR 등 최고 수준의 학회 및 저널에 발표된 120편 이상의 논문에서 얻은 통찰력을 종합하여, 지도 학습 기반 CIR 및 제로샷 CIR 모델을 세분화된 분류 체계를 사용하여 체계적으로 분류합니다. 속성 기반 CIR 및 대화형 CIR과 같은 CIR과 밀접하게 관련된 작업에 대한 접근 방식도 간략하게 논의하고, 평가를 위한 벤치마크 데이터셋을 요약하며, 여러 데이터셋에 걸쳐 실험 결과를 비교하여 기존의 지도 학습 기반 및 제로샷 CIR 방법을 분석합니다. 마지막으로, 이 분야의 유망한 미래 방향을 제시하고, 추가 탐구에 관심 있는 연구자들을 위한 실용적인 통찰력을 제공합니다.

시사점, 한계점

시사점:
CIR 분야에 대한 최초의 종합적인 검토 논문 제공
지도 학습 기반 및 제로샷 CIR 모델에 대한 세분화된 분류 체계 제시
다양한 데이터셋에 대한 실험 결과 비교 분석을 통해 기존 방법들의 성능 비교 제공
CIR 분야의 미래 연구 방향 제시 및 실용적인 통찰력 제공
한계점:
본 논문이 발표된 시점(2025년 2월) 이후 발표된 연구는 포함하지 않음.
CIR의 모든 하위 영역을 완벽하게 포괄하지 못할 가능성 존재.
다양한 CIR 모델들의 장단점에 대한 심층적인 비교 분석이 부족할 수 있음.
👍