본 논문은 자율 주행 환경에서 지속적 강화 학습(Continual Reinforcement Learning, CRL)의 과제를 실험을 통해 밝히고 있습니다. 특히, PPO(Proximal Policy Optimisation)를 사용하여 다양한 각도로 배치된 주차 공간에서 성공적으로 주차하는 에이전트를 훈련하는 것을 목표로 합니다. 실험 결과, 환경의 적절한 추상화, 하이퍼파라미터 민감도, 파국적 망각, 신경망 용량의 효율적 사용 등 CRL의 주요 과제를 확인했습니다.