본 논문은 이미지 기반 인간-객체 상호작용(HOI) 검출에 대한 최근 연구를 체계적으로 요약하고 논의한다. 주요 데이터셋을 소개하고, 2단계 방법과 종단간 1단계 검출 접근 방식을 중심으로 이미지 기반 HOI 검출의 현재 발전 상황을 분석하며 각 방법의 강점과 약점을 비교한다. 또한 제로샷 학습, 약지도 학습, 그리고 대규모 언어 모델의 HOI 검출 적용에 대한 발전 상황을 논의하고, 현재 HOI 검출의 과제와 잠재적인 연구 방향 및 미래 동향을 제시한다.