컴퓨터 비전의 핵심 과제인 인스턴스 분할, 시각적 접지, 객체 감지를 위해, 정확하고 확장 가능한 데이터 합성을 위한 새로운 객체 중심 합성 전략인 Synthetic Object Compositions (SOC)를 소개합니다. 3D 기하 레이아웃 증강, 카메라 구성 증강, 생성적 조화, 마스크 영역 가중 블렌딩을 사용하여 고품질의 합성 객체 세그먼트를 새로운 이미지로 구성합니다. 10만 개의 합성 이미지로 훈련된 모델이 더 큰 실제 데이터 세트 및 기존 합성 파이프라인보다 성능이 뛰어났으며, LVIS에서 +10.9 AP, gRefCOCO에서 +8.4 NAcc를 달성했습니다. SOC는 다양한 사용 사례에 맞는 제어 가능한 데이터 세트 구성도 가능하게 하며, 저데이터 및 폐쇄 어휘 시나리오에서 성능을 향상시킵니다.