본 논문은 로봇 에이전트 훈련을 위한 유망한 패러다임인 모방 학습에서, 기존 방식들이 안정적인 성능을 위해 많은 데모 또는 무작위 탐색을 통한 상당한 데이터 획득을 필요로 한다는 문제점을 지적합니다. 탐색은 인력을 줄이지만 안전성을 보장하지 못하고, 특히 공간 제약이 있는 작업(예: 핀-홀 작업)에서 충돌이 잦아 수동 환경 재설정으로 인한 추가적인 인력 부담이 발생합니다. 이에 본 연구는 단일 인간 데모로부터 정책 학습을 가능하게 하고, 자율적인 증강을 통해 데이터셋을 안전하게 확장하는 프레임워크인 Self-Augmented Robot Trajectory (SART)를 제안합니다. SART는 인간이 한 번만 가르치는 단계(단일 데모 제공 및 주요 경유지 주변 구체로 표현된 정밀도 경계 주석, 환경 재설정 한 번)와 로봇 자기 증강 단계(로봇이 이러한 경계 내에서 다양하고 충돌 없는 궤적을 생성하고 원래 데모에 재연결)로 구성됩니다. 이 설계는 인력을 최소화하면서 안전성을 보장하여 데이터 수집 효율성을 향상시킵니다. 시뮬레이션과 실제 조작 작업에 대한 광범위한 평가 결과, SART는 인간이 수집한 데모로만 훈련된 정책보다 훨씬 높은 성공률을 달성하는 것으로 나타났습니다. 비디오 결과는 https://sites.google.com/view/sart-il 에서 확인할 수 있습니다.