LineRides: Line-Guided Reinforcement Learning for Bicycle Robot Stunts

작성자

Haebom

카테고리

Empty

저자

Seungeun Rho, Shamel Fahmi, Jeonghwan Kim, Arianna Ilvonen, Sehoon Ha, Gabriel Nelson

💡 개요

본 논문은 강화학습에서 복잡한 로봇 곡예 동작 학습의 어려움을 해결하기 위해, 시연이나 명시적인 타이밍 정보 없이 사용자가 제공한 공간적 지침(라인)과 희소한 핵심 방향 정보만으로 자전거 로봇이 다양한 명령 가능한 곡예 동작을 습득하도록 하는 'LineRides' 프레임워크를 제안합니다. LineRides는 물리적으로 불가능한 지침에 대한 추적 마진, 진행 측정 방식, 그리고 위치 및 순서 기반 핵심 방향을 통해 학습 과정을 해결합니다. 이를 통해 자전거 로봇이 일반 주행과 곡예 실행 간의 부드러운 전환을 지원하며 MiniHop, LargeHop, ThreePointTurn, Backflip, DriftTurn 등 다섯 가지 독특한 곡예를 명령에 따라 수행할 수 있음을 보여줍니다.

🔑 시사점 및 한계

•

다양한 곡예 동작을 직접적인 시연이나 복잡한 보상 함수 없이 공간적 지침만으로 학습 가능하게 하여, 새로운 플랫폼이나 극한의 동작에 대한 적용 가능성을 높였습니다.

•

물리적으로 불가능한 지침에 대한 '추적 마진'과 이동 거리를 통한 진행 측정 방식은 학습의 안정성과 유연성을 향상시켰습니다.

•

핵심 방향 정보만으로 동작의 세부 사항을 명확히 하여, 학습 효율성을 높이고 사용자 제어를 용이하게 합니다.

•

본 연구는 특정 자전거 로봇 플랫폼에 적용되었으며, 복잡성이 더 높은 동작이나 불확실성이 더 큰 환경에서의 일반화 성능에 대한 추가적인 검증이 필요합니다.

PDF 보기

Made with Slashpage