Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

Created by
  • Haebom

저자

Yu Zhang, Yuqi Xie, Huihan Liu, Rutav Shah, Michael Wan, Linxi Fan, Yuke Zhu

개요

SCIZOR는 모방 학습에서 저품질 데이터로 인한 성능 저하 문제를 해결하기 위한 자기 지도 학습 기반 데이터 큐레이션 프레임워크입니다. 기존의 수동 주석 기반의 조잡한 데이터 큐레이션 방식과 달리, SCIZOR는 개별 상태-행동 쌍의 품질을 고려하여 저품질 데이터를 제거합니다. 구체적으로, 작업 진행 상황 예측기를 사용하여 최적이 아닌 데이터(suboptimal data)를 제거하고, 상태-행동 표현에 대한 중복 제거 모듈을 사용하여 중복 데이터(redundant data)를 제거합니다. 실험 결과, SCIZOR는 여러 벤치마크에서 평균 15.4%의 성능 향상을 달성했습니다.

시사점, 한계점

시사점:
자기 지도 학습 기반의 효율적인 데이터 큐레이션 방법 제시
개별 상태-행동 쌍 수준의 미세한 큐레이션 가능
모방 학습 성능 향상 및 데이터 효율 증대
저품질 데이터의 두 가지 주요 원인(최적이 아닌 데이터, 중복 데이터)을 동시에 해결
한계점:
제시된 벤치마크 외 다른 로봇 작업 환경에서의 일반화 성능 검증 필요
자기 지도 학습 기반 예측기의 정확도에 대한 추가적인 분석 필요
특정 로봇 작업에 특화된 요소가 포함되어 다른 작업으로의 전이 학습 가능성에 대한 추가 연구 필요
👍