Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Deep reinforcement learning-based longitudinal control strategy for automated vehicles at signalised intersections

Created by
  • Haebom

저자

Pankaj Kumar, Aditya Mishra, Pranamesh Chakraborty, Subrahmanya Swamy Peruru

개요

본 논문은 신호등 교차로에서의 자율주행 차량의 종방향 제어 전략을 제시합니다. 거리 간격 기반 효율성 보상, 황색 신호등 상황에서의 의사결정 기준, 비대칭 가속/감속 반응 등을 포함하는 종합적인 보상 함수를 도입하여 Deep Deterministic Policy Gradient (DDPG)와 Soft-Actor Critic (SAC) 두 가지 강화학습 알고리즘에 적용했습니다. 실제 선행 차량 궤적과 Ornstein-Uhlenbeck (OU) 프로세스를 이용하여 생성된 시뮬레이션 궤적을 결합하여 모델을 학습시켰으며, 누적분포함수(CDF)를 이용하여 성능을 평가하고 실제 궤적 데이터와 비교했습니다. 결과적으로 제안된 모델은 안전성을 저해하지 않으면서 인간 운전 차량보다 낮은 거리 간격(즉, 높은 효율성)과 저크를 유지하는 것을 보여주었습니다. 또한 다양한 안전 중요 상황에서 모델의 성능을 평가하여 강건성을 확인했습니다.

시사점, 한계점

시사점:
신호등 교차로에서의 자율주행 차량 종방향 제어에 대한 효과적인 강화학습 기반 전략 제시.
DDPG와 SAC 알고리즘을 이용하여 안전성, 효율성, 편안함을 향상시킬 수 있음을 입증.
실제 데이터와 시뮬레이션 데이터를 결합하여 모델의 일반화 성능 향상.
다양한 안전 중요 상황에서의 강건성 검증.
한계점:
제한된 실험 환경. 실제 도로 환경에서의 일반화 성능에 대한 추가적인 연구 필요.
다른 강화학습 알고리즘이나 제어 전략과의 비교 분석 부족.
장기간 운행 시 발생할 수 있는 문제점에 대한 고려 부족.
SAC 모델 대비 DDPG 모델의 부드러운 동작 특성은 상황에 따라 장단점이 될 수 있음. 더욱 세밀한 분석 필요.
👍