Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real

Created by
  • Haebom

저자

Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury

개요

X-Sim은 사람의 조작 동작을 로봇 제어 정책으로 학습시키는 real-to-sim-to-real 프레임워크입니다. RGBD 영상에서 사실적인 시뮬레이션을 재구성하고, 물체 궤적을 추적하여 물체 중심 보상을 정의합니다. 이 보상을 사용하여 시뮬레이션에서 강화 학습(RL) 정책을 학습하고, 다양한 시점과 조명으로 렌더링된 합성 롤아웃을 사용하여 이미지 조건부 확산 정책으로 증류합니다. 실제 환경으로 전이하기 위해 온라인 도메인 적응 기법을 도입하여 배포 중에 실제 및 시뮬레이션 관측값을 정렬합니다. 로봇 원격 조작 데이터 없이도 작동하며, 5가지 조작 작업에서 평균 30%의 성능 향상을 보였고, 행동 복제와 비교하여 데이터 수집 시간을 10배 단축했습니다. 새로운 카메라 시점과 테스트 시간 변경에도 일반화됩니다.

시사점, 한계점

시사점:
사람의 비디오만을 이용하여 로봇 조작 정책 학습이 가능하며, 기존 방법보다 데이터 수집 시간을 크게 단축합니다.
물체 궤적을 이용한 dense and transferable signal을 사용하여 sim-to-real 전이 성능을 향상시켰습니다.
다양한 시점과 조명 변화에 대한 일반화 성능이 우수합니다.
로봇 원격 조작 데이터가 필요 없습니다.
한계점:
제시된 5가지 조작 작업과 2개의 환경 외 다른 작업 및 환경에 대한 일반화 성능은 추가적인 검증이 필요합니다.
온라인 도메인 적응 기법의 성능과 안정성에 대한 추가적인 분석이 필요합니다.
RGBD 영상의 정확한 재구성이 시스템 성능에 영향을 미칠 수 있습니다.
👍