Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

Created by
  • Haebom

저자

Yu Zhang, Yuqi Xie, Huihan Liu, Rutav Shah, Michael Wan, Linxi Fan, Yuke Zhu

개요

본 논문은 로봇의 다양한 행동을 학습시키는 모방 학습에서, 대규모 데이터셋의 품질 저하 문제를 해결하기 위해 자기 지도 학습 기반의 데이터 정제 프레임워크인 SCIZOR를 제안합니다. SCIZOR는 최적이 아닌 데이터(task progression 부족)와 중복 데이터(redundant patterns)라는 두 가지 저품질 데이터 원인을 다룹니다. 최적이 아닌 데이터는 자기 지도 학습 기반의 작업 진행 예측기를 사용하여 제거하고, 중복 데이터는 joint state-action 표현에 대한 중복 제거 모듈을 사용하여 제거합니다. 실험 결과, SCIZOR는 여러 벤치마크에서 평균 15.4%의 성능 향상을 보이며, 적은 데이터로도 높은 성능의 모방 학습 정책을 달성함을 보여줍니다.

시사점, 한계점

시사점:
자기 지도 학습을 이용한 효율적인 로봇 데이터 정제 방법 제시
기존의 dataset 또는 trajectory level의 조잡한 정제 방식 대비, state-action pair level의 정밀한 정제 가능
적은 데이터로 높은 성능의 모방 학습 정책 학습 가능
최적이 아닌 데이터와 중복 데이터를 동시에 처리하여 데이터 품질 향상
한계점:
SCIZOR의 성능은 자기 지도 학습 기반의 task progress predictor와 deduplication module의 성능에 의존적일 수 있음.
제안된 방법의 일반화 성능에 대한 추가적인 연구가 필요함. 다양한 로봇 작업 및 데이터셋에 대한 적용성 검증이 필요함.
task progress predictor 및 deduplication module의 설계 및 파라미터 설정에 대한 추가적인 설명과 분석이 필요함.
👍