본 논문은 이미지 복사-붙여넣기 합성 문제에서 객체 배치 학습에 초점을 맞추고 있습니다. 기존 방법들은 생성 모델을 활용하여 밀집된 감독에 대한 의존성을 줄였지만, 복잡한 데이터 분포를 모델링하는 능력이 제한적이었습니다. 반면, 희소 대조 손실을 사용하는 트랜스포머 네트워크는 과도한 완화 규제로 인해 객체 배치가 부정확해지는 문제가 있었습니다. 본 논문에서는 객체 배치를 배치-탐지 문제로 공식화하는 새로운 패러다임인 BOOTPLACE를 제시합니다. BOOTPLACE는 객체가 제거된 배경 이미지에 다중 객체 감독을 추가하여 훈련된 특수 탐지 트랜스포머를 사용하여 객체 배치에 적합한 관심 영역을 식별합니다. 그런 다음, 상보적인 특징을 기반으로 각 대상 합성 객체를 탐지된 영역과 의미적으로 연결합니다. 무작위로 객체가 제거된 이미지에 부트스트랩 훈련 방식을 적용하여 광범위한 쌍 데이터 증강을 통해 의미 있는 배치를 강화합니다. Cityscapes 및 OPA 데이터셋에서 기존 최고 성능 기준보다 IOU 점수가 현저히 향상되는 등 기준 벤치마크에서 우수한 성능을 보여줍니다. 추가적인 절제 연구를 통해 구성성과 일반화 가능성을 보여주며, 사용자 연구 평가 결과도 제시합니다.