SCIZOR는 모방 학습에서 저품질 데이터로 인한 성능 저하 문제를 해결하기 위한 자기 지도 학습 기반 데이터 큐레이션 프레임워크입니다. 기존의 수동 주석 기반의 조잡한 데이터 큐레이션 방식과 달리, SCIZOR는 개별 상태-행동 쌍의 품질을 고려하여 저품질 데이터를 제거합니다. 구체적으로, 작업 진행 상황 예측기를 사용하여 최적이 아닌 데이터(suboptimal data)를 제거하고, 상태-행동 표현에 대한 중복 제거 모듈을 사용하여 중복 데이터(redundant data)를 제거합니다. 실험 결과, SCIZOR는 여러 벤치마크에서 평균 15.4%의 성능 향상을 달성했습니다.