Guiding Data Collection via Factored Scaling Curves
Created by
Haebom
저자
Lihan Zha, Apurva Badithela, Michael Zhang, Justin Lidard, Jeremy Bao, Emily Zhou, David Snyder, Allen Z. Ren, Dhruv Shah, Anirudha Majumdar
개요
본 논문은 다양한 조작 작업을 해결하는 데 큰 가능성을 보이는 대규모 데이터셋으로 훈련된 일반화된 모방 학습 정책에 대해 다룹니다. 하지만 다양한 조건으로의 일반화를 보장하려면 카메라 위치, 테이블 높이, 방해 요소 등 광범위한 환경 요소 변화에 걸쳐 수집된 데이터로 정책을 훈련해야 합니다. 이는 완벽하게 수행하면 매우 비용이 많이 드는 작업입니다. 본 논문에서는 요인별 스케일링 곡선(FSC)을 구성하여 정책 성능이 개별 또는 쌍으로 이루어진 요인에 따라 데이터가 확장됨에 따라 어떻게 변하는지 정량화함으로써 어떤 데이터를 얼마나 수집할지 결정하기 위한 원칙적인 방법을 제시합니다. 이러한 곡선을 통해 주어진 예산 내에서 가장 영향력 있는 요인 조합에 대한 표적 데이터 수집이 가능합니다. 본 논문에서는 시뮬레이션 및 실제 환경에서 광범위한 실험을 통해 처음부터 훈련하는 경우와 미세 조정하는 경우 모두에 대해 제안된 방법을 평가하고, 새로운 환경에서 실제 작업의 성공률을 기존 데이터 수집 전략보다 최대 26% 향상시키는 것을 보여줍니다. 또한 대규모 실제 환경 평가 없이 오프라인 지표를 사용하여 요인별 스케일링 곡선이 데이터 수집을 효과적으로 안내할 수 있음을 보여줍니다.