Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving

Created by
  • Haebom
Category
Empty

저자

Haohong Lin, Yunzhi Zhang, Wenhao Ding, Jiajun Wu, Ding Zhao

개요

본 논문은 종단간(E2E) 자율 주행 모델이 폐쇄 루프 환경에서 발생하는 오류 누적 및 일반화 성능 저하 문제를 해결하기 위해, 사전 훈련된 E2E 주행 에이전트의 견고성과 안전성을 향상시키는 일반적인 프레임워크인 Model-based Policy Adaptation (MPA)을 제안합니다. MPA는 기하학적으로 일관된 시뮬레이션 엔진을 사용하여 다양한 반사실적 궤적을 생성하고, 확산 기반 정책 어댑터를 훈련하여 기본 정책의 예측을 개선하며, 다단계 Q 값 모델을 통해 장기적인 결과를 평가합니다. 추론 시 어댑터는 여러 궤적 후보를 제안하고, Q 값 모델은 예상 효용이 가장 높은 궤적을 선택합니다. nuScenes 벤치마크를 활용한 실험에서 MPA는 성능을 크게 향상시켰습니다.

시사점, 한계점

시사점:
E2E 자율 주행 모델의 폐쇄 루프 성능 향상에 기여.
다양한 시나리오에 대한 에이전트의 일반화 능력 및 안전성 강화.
반사실적 데이터 생성 및 확산 기반 정책 어댑터 활용의 효과 입증.
Q 값 모델을 이용한 장기적 결과 평가를 통해 성능 개선.
한계점:
MPA의 효과는 반사실적 데이터 규모 및 추론 시의 가이드 전략에 따라 달라짐.
실제 환경에서의 성능 검증 필요.
계산 비용 및 모델 복잡성 고려 필요.
👍