Sign In

Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback

Created by
  • Haebom
Category
Empty

저자

Feng Gao, Chao Yu, Yu Wang, Yi Wu

개요

본 논문은 복잡한 환경에서의 외란에도 정확한 동작 제어를 달성하는 새로운 프레임워크인 Neural Internal Model Control (Neural IMC)을 제안합니다. 기존의 모델 기반 제어 방식의 비선형성 및 비구조적 외란에 대한 취약성과 강화학습 기반 제어 방식의 미지 상황에 대한 취약성을 극복하기 위해, 모델 기반 제어와 강화학습 기반 제어를 통합하는 접근 방식을 취합니다. 강체 역학에 대한 Newton-Euler 방정식을 사용하여 예측 모델을 간소화하여 복잡한 고차원 비선형성을 캡처할 필요성을 제거하고, 모델-프리 강화학습 알고리즘과 예측 오차 피드백을 결합한 내부 모델을 구성하여 폐루프 제어 구조를 구현함으로써 제어 시스템의 강건성과 일반화 성능을 향상시킵니다. 쿼드로터와 4족 로봇에 대한 실험을 통해 기존 최첨단 기법보다 우수한 성능을 달성했으며, 로프로 매달린 페이로드를 탑재한 쿼드로터에 대한 실제 환경 배치 실험을 통해 시뮬레이션-실제 전이(sim-to-real transfer)의 강건성을 보여줍니다. 소스 코드는 https://github.com/thu-uav/NeuralIMC 에서 공개됩니다.

시사점, 한계점

시사점:
모델 기반 제어와 강화학습 기반 제어의 장점을 통합하여 복잡한 환경에서의 강건하고 일반화된 로봇 동작 제어를 가능하게 함.
Newton-Euler 방정식을 이용한 예측 모델 간소화를 통해 계산 복잡도를 낮추고 실시간 제어에 적합하게 함.
쿼드로터와 4족 로봇에서의 실험을 통해 우수한 성능을 검증하고, 실제 환경 배치 실험을 통해 sim-to-real 전이 성능을 확인.
공개된 소스 코드를 통해 재현성과 추가 연구를 지원.
한계점:
제안된 방법의 적용 가능성은 Newton-Euler 방정식을 적용할 수 있는 강체 시스템에 제한될 수 있음.
다양한 환경과 작업에 대한 일반화 성능에 대한 추가적인 검증이 필요함.
강화학습의 학습 과정에 대한 자세한 분석과 해석이 부족할 수 있음.
실제 환경에서의 극한 상황에 대한 내구성 평가가 추가적으로 필요함.
👍