Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

When a Robot is More Capable than a Human: Learning from Constrained Demonstrators

Created by
  • Haebom

저자

Xinhu Li, Ayush Jain, Zhaojing Yang, Yigit Korkmaz, Erdem B{\i}y{\i}k

개요

전문가의 시연으로부터 학습하는 것은 로봇이 운동 감각 지도, 조이스틱 제어, 시뮬레이션-현실 전송과 같은 인터페이스를 사용하여 복잡한 작업을 가르칠 수 있게 한다. 그러나 이러한 인터페이스는 간접 제어, 설정 제한 및 하드웨어 안전으로 인해 전문가가 최적의 동작을 시연하는 능력을 제한하는 경우가 많다. 본 논문은 제한된 전문가가 시연한 것보다 더 나은 정책을 로봇이 학습할 수 있는지를 연구한다. 에이전트가 전문가의 직접적인 모방을 넘어 짧고 더 효율적인 궤적을 탐색하도록 허용함으로써 이를 해결한다. 시연을 사용하여 작업 진행 상황을 측정하는 상태 전용 보상 신호를 추론하고, 시간적 보간을 사용하여 알려지지 않은 상태에 대한 자체 라벨 보상을 생성한다. 제안하는 접근 방식은 샘플 효율성과 작업 완료 시간 모두에서 일반적인 모방 학습보다 우수하다. 실제 WidowX 로봇 팔에서 행동 복제보다 10배 빠른 12초 만에 작업을 완료한다.

시사점, 한계점

시사점:
제한된 전문가의 시연으로부터도 로봇이 더 나은 정책을 학습할 수 있음을 입증.
상태 전용 보상 신호와 시간적 보간을 활용하여 샘플 효율성 및 작업 완료 시간을 향상.
실제 로봇 팔에서의 실험을 통해 제안 방법의 실용성을 입증.
한계점:
논문에 구체적인 한계점에 대한 언급 없음.
👍