Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Raw2Drive: Reinforcement Learning with Aligned World Models for End-to-End Autonomous Driving (in CARLA v2)

Created by
  • Haebom

저자

Zhenjie Yang, Xiaosong Jia, Qifeng Li, Xue Yang, Maoqing Yao, Junchi Yan

개요

본 논문은 강화학습(RL)을 활용하여 종단간 자율주행(E2E-AD) 문제를 해결하고자 제안된 Raw2Drive 모델을 소개합니다. 기존 모방학습(IL)의 한계인 인과적 혼란과 분포 이동 문제를 RL로 완화하고자 하며, 특히 모델 기반 강화학습(MBRL)의 장점을 활용합니다. Raw2Drive는 privileged information을 사용하는 보조 세계 모델과 raw sensor data를 사용하는 세계 모델을 병렬적으로 학습시키는 dual-stream MBRL 접근 방식을 채택합니다. 제안된 Guidance Mechanism을 통해 두 모델 간의 일관성을 유지하며, privileged world model의 지식을 raw sensor world model에 전달하여 효과적인 정책 학습을 가능하게 합니다. CARLA Leaderboard 2.0 및 Bench2Drive에서 최첨단 성능을 달성하였으며, 해당 리더보드에 등록된 유일한 RL 기반 종단간 자율주행 방법입니다.

시사점, 한계점

시사점:
종단간 자율주행에서 RL의 적용 가능성을 높였습니다.
raw sensor data만을 이용하여 MBRL을 성공적으로 적용한 사례를 제시했습니다.
CARLA Leaderboard 2.0 및 Bench2Drive에서 최첨단 성능을 달성했습니다.
privileged information을 효과적으로 활용하여 raw sensor 기반 모델 학습을 개선했습니다.
한계점:
Guidance Mechanism의 구체적인 설계 및 성능에 대한 자세한 분석이 부족할 수 있습니다.
다른 RL 기반 종단간 자율주행 방법과의 비교 분석이 더욱 필요할 수 있습니다.
실제 도로 환경에서의 일반화 성능에 대한 검증이 필요합니다.
계산 비용 및 학습 시간에 대한 분석이 부족할 수 있습니다.
👍