# A Comprehensive Survey on Composed Image Retrieval

### 저자

Xuemeng Song, Haoqiang Lin, Haokun Wen, Bohan Hou, Mingzhu Xu, Liqiang Nie

### 개요

본 논문은 구성 이미지 검색(CIR) 분야에 대한 종합적인 검토를 제공합니다. CIR은 참조 이미지와 사용자가 원하는 변경 사항을 명시하는 수정 텍스트로 구성된 다중 모드 쿼리를 사용하여 대상 이미지를 검색할 수 있게 하는 새로운 과제입니다. 본 논문은 ACM TOIS, SIGIR, CVPR 등 최고 수준의 학회 및 저널에 발표된 120편 이상의 논문에서 얻은 통찰력을 종합하여, 지도 학습 기반 CIR 및 제로샷 CIR 모델을 세분화된 분류 체계를 사용하여 체계적으로 분류합니다.  속성 기반 CIR 및 대화형 CIR과 같은 CIR과 밀접하게 관련된 작업에 대한 접근 방식도 간략하게 논의하고, 평가를 위한 벤치마크 데이터셋을 요약하며, 여러 데이터셋에 걸쳐 실험 결과를 비교하여 기존의 지도 학습 기반 및 제로샷 CIR 방법을 분석합니다.  마지막으로, 이 분야의 유망한 미래 방향을 제시하고, 추가 탐구에 관심 있는 연구자들을 위한 실용적인 통찰력을 제공합니다.

### 시사점, 한계점

- **시사점:**

    - CIR 분야에 대한 최초의 종합적인 검토 논문 제공

    - 지도 학습 기반 및 제로샷 CIR 모델에 대한 세분화된 분류 체계 제시

    - 다양한 데이터셋에 대한 실험 결과 비교 분석을 통해 기존 방법들의 성능 비교 제공

    - CIR 분야의 미래 연구 방향 제시 및 실용적인 통찰력 제공

- **한계점:**

    - 본 논문이 발표된 시점(2025년 2월) 이후 발표된 연구는 포함하지 않음.

    - CIR의 모든 하위 영역을 완벽하게 포괄하지 못할 가능성 존재.

    - 다양한 CIR 모델들의 장단점에 대한 심층적인 비교 분석이 부족할 수 있음.

[PDF 보기](https://arxiv.org/pdf/2502.18495)

![https://i.imgur.com/VNGEdbc.jpeg](https://i.imgur.com/VNGEdbc.jpeg)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
