GAP: Geometric Anchor Pre-training for Data-Efficient Visuomotor Learning of Manipulation Tasks

작성자

Haebom

카테고리

Empty

저자

Davide Buoso, Andrea Protopapa, Stefano Di Carlo, Francesca Pistilli, Giuseppe Averta

💡 개요

본 논문은 희소한 전문가 시연 데이터로 로봇 조작 학습 시, 고차원 RGB 영상 표현을 제어 관련 기하학적 정보로 효과적으로 추출하는 문제를 해결하기 위해 Geometric Anchor Pre-training (GAP)이라는 새로운 사전 학습 기법을 제안합니다. GAP는 물체 마스크를 활용한 가벼운 시뮬레이션 프록시 태스크에서 공간 어댑터를 사전 학습시켜, 안정적이고 신뢰할 수 있는 기하학적 앵커를 생성함으로써 적은 데이터로도 효과적인 정책 학습을 가능하게 합니다.

🔑 시사점 및 한계

•

데이터 효율성을 극대화하여 희소한 시연 데이터로도 로봇 조작 학습을 가능하게 합니다.

•

생성된 기하학적 앵커는 장면 변화나 작은 교란에도 강건하여 안정적인 제어 인터페이스를 제공합니다.

•

사전 학습 단계는 가볍고 기존 VFM을 동결시킨 상태에서 진행되므로 실제 적용에 용이하며 재사용성이 높습니다.

•

제안된 방법론은 특정 물체 마스크가 필요한 프록시 태스크에 의존하므로, 마스크 정보가 부족하거나 추출하기 어려운 복잡한 환경에서는 적용에 제약이 있을 수 있습니다.

PDF 보기

Made with Slashpage