[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation

Created by
  • Haebom

저자

Dohyun Kim, Jayden Dongwoo Lee, Hyochoong Bang, Jungho Bae

개요

본 논문은 멀티로터 시스템의 액추에이터 고장에 대한 내성을 강화하기 위해, 트랜스포머 기반의 온라인 적응 모듈이 통합된 새로운 하이브리드 강화학습 기반 내결함 제어(FTC) 프레임워크를 제안한다. 기존의 강화학습 기반 FTC 접근 방식은 멀티로터 모델에 대한 사전 지식이 필요하거나 새로운 구성에 적응하는 데 어려움을 겪는다는 한계를 극복하기 위해, 트랜스포머 아키텍처를 활용하여 실시간으로 잠재적 표현을 추론함으로써 재훈련 없이 이전에 보지 못한 시스템 모델에도 적응할 수 있도록 한다. PyBullet 시뮬레이션에서 액추에이터 효과 감소 오류 하에서 평가한 결과, 95%의 성공률과 0.129m의 위치 RMSE를 달성하여 기존 적응 방법(86% 성공률, 0.153m RMSE)보다 우수한 성능을 보였다. 다양한 구성의 쿼드로터에 대한 추가 평가는 훈련되지 않은 역학에서도 프레임워크의 강건성을 확인하였다. 이 결과는 본 프레임워크가 동적이고 불확실한 환경에서 효율적인 결함 관리를 가능하게 하여 멀티로터의 적응성과 신뢰성을 향상시킬 수 있는 잠재력을 보여준다.

시사점, 한계점

시사점:
트랜스포머 기반 온라인 적응 모듈을 통합하여 기존 강화학습 기반 FTC의 한계를 극복하고, 다양한 멀티로터 구성에 대한 적응성을 향상시켰다.
PyBullet 시뮬레이션 결과를 통해 제안된 프레임워크의 우수한 성능(95% 성공률, 0.129m RMSE)을 검증하였다.
훈련되지 않은 역학에서도 강건성을 유지함을 확인하여 실제 환경 적용 가능성을 높였다.
한계점:
현재는 PyBullet 시뮬레이션 환경에서만 평가되었으며, 실제 환경에서의 성능 검증이 필요하다.
다양한 유형의 고장에 대한 내성을 평가하지 않았으므로, 더욱 광범위한 고장 시나리오에 대한 추가적인 연구가 필요하다.
트랜스포머 모델의 계산 복잡도 및 실시간 처리 성능에 대한 추가적인 분석이 필요하다.
👍