X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
Created by
Haebom
저자
Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury
개요
X-Sim은 사람의 조작 동작을 로봇 제어 정책으로 학습시키는 real-to-sim-to-real 프레임워크입니다. RGBD 영상에서 사실적인 시뮬레이션을 재구성하고, 물체 궤적을 추적하여 물체 중심 보상을 정의합니다. 이 보상을 사용하여 시뮬레이션에서 강화 학습(RL) 정책을 학습하고, 다양한 시점과 조명으로 렌더링된 합성 롤아웃을 사용하여 이미지 조건부 확산 정책으로 증류합니다. 실제 환경으로 전이하기 위해 온라인 도메인 적응 기법을 도입하여 배포 중에 실제 및 시뮬레이션 관측값을 정렬합니다. 로봇 원격 조작 데이터 없이도 작동하며, 5가지 조작 작업에서 평균 30%의 성능 향상을 보였고, 행동 복제와 비교하여 데이터 수집 시간을 10배 단축했습니다. 새로운 카메라 시점과 테스트 시간 변경에도 일반화됩니다.
시사점, 한계점
•
시사점:
◦
사람의 비디오만을 이용하여 로봇 조작 정책 학습이 가능하며, 기존 방법보다 데이터 수집 시간을 크게 단축합니다.
◦
물체 궤적을 이용한 dense and transferable signal을 사용하여 sim-to-real 전이 성능을 향상시켰습니다.
◦
다양한 시점과 조명 변화에 대한 일반화 성능이 우수합니다.
◦
로봇 원격 조작 데이터가 필요 없습니다.
•
한계점:
◦
제시된 5가지 조작 작업과 2개의 환경 외 다른 작업 및 환경에 대한 일반화 성능은 추가적인 검증이 필요합니다.