Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

TreeIRL: Safe Urban Driving with Tree Search and Inverse Reinforcement Learning

Created by
  • Haebom

저자

Momchil S. Tomov, Sang Uk Lee, Hansford Hendrago, Jinwook Huh, Teawon Han, Forbes Howington, Rafael da Silva, Gianmarco Bernasconi, Marc Heim, Samuel Findler, Xiaonan Ji, Alexander Boule, Michael Napoli, Kuo Chen, Jesse Miller, Boaz Floor, Yunqing Hu

TreeIRL: 자율 주행을 위한 MCTS와 IRL 결합

개요

본 논문은 자율 주행을 위한 새로운 플래너인 TreeIRL을 제시한다. TreeIRL은 몬테카를로 트리 탐색(MCTS)과 역강화 학습(IRL)을 결합하여 시뮬레이션 및 실제 주행에서 최고 수준의 성능을 달성한다. 핵심 아이디어는 MCTS를 사용하여 안전한 후보 궤적 세트를 찾고, 심층 IRL 점수 함수를 사용하여 그중 가장 인간과 유사한 궤적을 선택하는 것이다. TreeIRL은 대규모 시뮬레이션과 라스베이거스 대도시 지역에서 500마일 이상의 실제 자율 주행 환경에서 고전적 플래너 및 최첨단 플래너와 비교 평가되었다. 테스트 시나리오에는 혼잡한 도심 교통, 어댑티브 크루즈 컨트롤, 끼어들기, 신호등이 포함된다. TreeIRL은 안전성, 진행, 편안함 및 인간 유사성 간의 균형을 이루며 최고의 전반적인 성능을 달성한다.

시사점, 한계점

MCTS 기반 플래닝을 공공 도로에서 처음으로 시연
다양한 메트릭 및 실제 환경에서 플래너 평가의 중요성 강조
안전성, 진행, 편안함 및 인간 유사성을 균형 있게 달성
강화 학습 및 모방 학습을 통해 TreeIRL의 확장 및 개선 가능성 제시
자율 주행의 플래닝 병목 현상을 해결하기 위한 고전적 방법과 학습 기반 방법의 다양한 조합 탐색 프레임워크 제공
👍