본 논문은 시뮬레이션 환경에서 심층 강화 학습(DRL)을 이용하여 그립 한계 주행 문제를 해결하는 방법을 연구합니다. 경주용 자동차에 개발된 알고리즘이 도로 주행에도 유용하다는 점에 착안하여, 근위 정책 최적화(PPO) 방법을 사용하여 시각 정보만으로 차량의 조향 및 페달을 제어하고 전문 드라이버 수준의 랩타임을 달성하는 에이전트를 훈련시켰습니다. 레이스 트랙에서의 시간 최적 주행 과제를 심층 강화 학습 문제로 공식화하고, 선택된 관측값, 행동 및 보상 함수를 설명합니다. 실험 결과는 최대 타이어 그립 잠재력을 활용하는 인간과 유사한 학습 및 주행 행동을 보여줍니다.