Sign In

Interactive Double Deep Q-network: Integrating Human Interventions and Evaluative Predictions in Reinforcement Learning of Autonomous Driving

Created by
  • Haebom
Category
Empty

저자

Alkis Sygkounas, Ioannis Athanasiadis, Andreas Persson, Michael Felsberg, Amy Loutfi

개요

본 논문은 자율 주행과 같이 높은 정확도와 안전성이 요구되는 응용 분야에서 인간 전문 지식과 기계 학습을 통합하는 Interactive Double Deep Q-network (iDDQN) 방법을 제시합니다. iDDQN은 강화 학습(RL) 훈련 과정에 인간의 통찰력을 직접 통합하는 Human-in-the-Loop (HITL) 접근 방식으로, 모델 성능을 향상시킵니다. Q-값 업데이트 방정식을 수정하여 인간과 에이전트의 행동을 통합함으로써 정책 개발을 위한 협업적 접근 방식을 구축합니다. 또한, 인간의 개입이 없었던 것처럼 에이전트의 궤적을 시뮬레이션하는 오프라인 평가 프레임워크를 제시하여 인간 개입의 효과를 평가합니다. 시뮬레이션된 자율 주행 시나리오에서의 실험 결과는 iDDQN이 Behavioral Cloning (BC), HG-DAgger, Deep Q-Learning from Demonstrations (DQfD) 및 일반적인 DRL을 포함한 기존 방법보다 성능 향상 및 적응성 측면에서 인간 전문 지식을 활용하는 데 더 우수함을 보여줍니다.

시사점, 한계점

시사점:
인간의 전문 지식을 강화 학습에 효과적으로 통합하는 새로운 방법(iDDQN)을 제시.
기존 방법들보다 자율 주행 시나리오에서 향상된 성능과 적응성을 보임.
인간 개입의 효과를 객관적으로 평가할 수 있는 오프라인 평가 프레임워크 제공.
자율 주행 시스템 개발에 있어 인간-기계 협업의 중요성을 강조.
한계점:
시뮬레이션 환경에서의 결과이므로 실제 자율 주행 환경에서의 성능은 추가 검증 필요.
인간 전문가의 개입 방식 및 빈도에 대한 최적화 연구 필요.
다양한 자율 주행 시나리오 및 복잡성에 대한 일반화 성능 검증 필요.
인간의 피드백에 대한 신뢰도 및 정확도에 대한 고려 필요.
👍