Curriculum-based Sample Efficient Reinforcement Learning for Robust Stabilization of a Quadrotor

Created by

Haebom

저자

Fausto Mauricio Lagos Suarez, Akshit Saradagi, Vidya Sumathy, Shruti Kotpaliwar, George Nikolakopoulos

💡 개요

본 논문은 쿼드로터의 견고한 자세 제어를 위한 샘플 효율적인 커리큘럼 학습(CL) 기반 강화학습(RL) 정책을 제안합니다. 제안된 3단계 커리큘럼은 복잡도를 점진적으로 높이며, 각 단계의 학습 내용을 다음 단계로 전달하여 훈련 효율성을 극대화합니다. 이를 통해 기존의 단일 단계 RL 방식 대비 훨씬 적은 계산 자원과 시간으로 뛰어난 성능과 견고성을 달성했습니다.

🔑 시사점 및 한계

•

샘플 효율성 극대화: 커리큘럼 학습을 통해 복잡한 RL 문제를 효율적으로 분해하고 학습시켜, 쿼드로터 제어와 같이 샘플 효율성이 중요한 분야에 효과적으로 적용될 수 있습니다.

•

견고한 제어 성능 확보: 제안된 커리큘럼은 다양한 초기 조건 및 비행 시나리오에서도 안정적인 자세 제어 성능을 보장하며, 특히 항공 검사 작업에 요구되는 요구사항을 충족합니다.

•

한계점: 3단계로 구성된 커리큘럼의 최적화 여부, 실제 하드웨어 적용 시의 추가적인 고려 사항 등에 대한 연구가 더 필요할 수 있습니다.

PDF 보기

Made with Slashpage