Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

TreeIRL: Safe Urban Driving with Tree Search and Inverse Reinforcement Learning

Created by
  • Haebom

저자

Momchil S. Tomov, Sang Uk Lee, Hansford Hendrago, Jinwook Huh, Teawon Han, Forbes Howington, Rafael da Silva, Gianmarco Bernasconi, Marc Heim, Samuel Findler, Xiaonan Ji, Alexander Boule, Michael Napoli, Kuo Chen, Jesse Miller, Boaz Floor, Yunqing Hu

개요

TreeIRL은 자율 주행을 위한 새로운 플래너로, 몬테 카를로 트리 탐색(MCTS)과 역강화 학습(IRL)을 결합하여 시뮬레이션 및 실제 주행에서 최고 성능을 달성합니다. MCTS를 사용하여 안전한 후보 궤적 집합을 찾고, 심층 IRL 점수 함수를 사용하여 그 중에서 가장 인간과 유사한 궤적을 선택합니다. TreeIRL은 대규모 시뮬레이션과 라스베이거스 대도시 지역에서 500마일 이상의 실제 자율 주행 환경에서 테스트되었습니다. 테스트 시나리오에는 혼잡한 도시 교통, 적응형 크루즈 컨트롤, 끼어들기 및 신호등이 포함됩니다. TreeIRL은 안전, 진척, 편안함 및 인간 유사성 간의 균형을 이루며 전반적으로 최고의 성능을 달성했습니다.

시사점, 한계점

MCTS 기반 계획이 공공 도로에서 처음으로 시연되었습니다.
다양한 메트릭과 실제 환경에서 플래너를 평가하는 것의 중요성을 강조합니다.
강화 학습 및 모방 학습으로 추가 개선이 가능하며, 자율 주행의 계획 병목 현상을 해결하기 위한 고전적 접근 방식과 학습 기반 접근 방식의 다양한 조합을 탐색하기 위한 프레임워크를 제공합니다.
👍