Sign In

Never too Prim to Swim: An LLM-Enhanced RL-based Adaptive S-Surface Controller for AUVs under Extreme Sea Conditions

Created by
  • Haebom
Category
Empty

저자

Guanwen Xie, Jingzehua Xu, Yimian Ding, Zhi Zhang, Shuai Zhang, Yi Li

개요

본 논문은 자율 수중 차량(AUV)의 적응성과 기동성 향상을 위해 대규모 언어 모델(LLM)을 강화 학습(RL) 기반 적응형 S-곡면 제어기에 통합하는 새로운 방법을 제시합니다. LLM은 RL 훈련 과정에서 제어기 매개변수와 보상 함수를 공동으로 최적화하는 데 사용되며, 다중 모드 및 구조화된 명시적 작업 피드백을 통해 여러 목표 간의 균형을 맞추고 작업 중심 성능 및 적응성을 향상시킵니다. 제안된 제어기는 상위 수준 작업에 RL 정책을 집중시켜 S-곡면 제어기가 비선형 효과와 예측할 수 없는 외부 방해를 상쇄하도록 고수준 명령을 생성합니다. 복잡한 지형, 파도 및 해류가 있는 극한 해양 환경에서 제안된 제어기는 수중 표적 추적 및 데이터 수집과 같은 고수준 작업에서 기존 PID 및 SMC 제어기보다 우수한 성능과 적응성을 보여줍니다.

시사점, 한계점

시사점:
LLM을 활용하여 RL 기반 AUV 제어기의 성능과 적응성을 향상시킬 수 있음을 보여줌.
다양한 목표를 동시에 고려하는 효율적인 제어 전략 제시.
극한 해양 환경에서도 우수한 성능을 발휘하는 AUV 제어 시스템 구축 가능성 제시.
고수준 작업에 집중하는 RL 정책과 저수준 제어를 담당하는 S-곡면 제어기의 효과적인 결합.
한계점:
제안된 방법의 실제 해양 환경에서의 장기적인 성능 및 안정성에 대한 추가적인 검증 필요.
LLM의 계산 비용 및 복잡성이 실시간 제어에 미치는 영향에 대한 분석 필요.
다양한 유형의 AUV 및 작업에 대한 일반화 가능성에 대한 추가 연구 필요.
사용된 LLM의 특정 구조 및 매개변수에 대한 상세한 설명 부족.
👍