Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Multi-Timescale Hierarchical Reinforcement Learning for Unified Behavior and Control of Autonomous Driving

Created by
  • Haebom
Category
Empty

저자

Guizhe Jin, Zhuoren Li, Bo Leng, Ran Yu, Lu Xiong, Chen Sun

개요

자율 주행 분야에서 강화 학습(RL)의 활용이 증가하고 있지만, 기존 RL 기반 자율 주행 방법들은 정책 구조 설계를 간과하는 경향이 있습니다. 단기 제어 명령만 출력하는 정책은 변동적인 주행 동작을 보이고, 장기 주행 목표만 출력하는 정책은 주행 행동과 제어를 통합적으로 최적화하기 어렵습니다. 본 논문에서는 다중 시간 척도 계층적 강화 학습 접근 방식을 제안합니다. 이는 고수준 및 저수준 RL 정책을 통합 학습하여 장기적인 움직임 지침과 단기 제어 명령을 각각 생성합니다. 움직임 지침은 하이브리드 액션을 통해 명시적으로 표현되어 구조화된 도로에서 다중 모드 주행 동작을 포착하고 점진적인 저수준 확장 상태 업데이트를 지원합니다. 또한, 다중 시간 척도 안전 메커니즘을 설계하여 안전성을 보장합니다. 시뮬레이터 및 HighD 데이터셋 기반 고속도로 다중 차선 시나리오 평가 결과, 제안된 방식이 자율 주행 성능을 유의미하게 향상시켜 주행 효율성, 행동 일관성 및 안전성을 효과적으로 증가시킴을 확인했습니다.

시사점, 한계점

시사점:
계층적 정책 구조를 통해 장기적 목표와 단기적 제어를 통합하여 자율 주행 성능 향상.
하이브리드 액션을 사용하여 다중 모드 주행 동작을 효과적으로 캡쳐.
다중 시간 척도 안전 메커니즘을 통해 안전성 확보.
시뮬레이션 및 실제 데이터셋 기반 평가를 통해 방법론의 효과 검증.
한계점:
논문에 명시된 한계점 정보는 없음.
👍