Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real

Created by
  • Haebom
Category
Empty

저자

Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury

X-Sim: Cross-Embodiment Robot Manipulation via Object Motion in Simulation

개요

본 논문은 인간의 비디오를 활용하여 로봇 조작 정책을 학습하는 새로운 프레임워크인 X-Sim을 제안합니다. X-Sim은 객체의 움직임을 밀집적이고 전송 가능한 신호로 활용하여, 실사 기반 시뮬레이션을 구축하고, 객체 중심 보상을 정의합니다. 강화 학습(RL)을 통해 시뮬레이션에서 정책을 학습시키고, 이를 이미지 조건부 확산 정책으로 증류합니다. 실제 세계로의 전송을 위해 온라인 도메인 적응 기술을 도입하여 실제와 시뮬레이션 간의 차이를 줄입니다. X-Sim은 로봇 원격 조작 데이터 없이, 5가지 조작 작업에서 기존 방법론 대비 성능 향상을 보였습니다.

시사점, 한계점

인간 비디오를 활용하여 로봇 조작 정책 학습.
객체 중심 보상을 사용한 강화 학습.
실제-시뮬레이션-실제 프레임워크 구축.
온라인 도메인 적응 기술 도입.
기존 방법론 대비 성능 향상 (평균 30% 개선).
데이터 수집 시간 단축 (행동 복제 대비 10배).
새로운 카메라 시점 및 테스트 시간 변화에 일반화.
별도의 로봇 원격 조작 데이터 불필요.
구체적인 한계점은 논문에서 상세히 제시되지 않음.
👍