자율 주행 시뮬레이션 환경에서 복잡한 상황에서의 자율 주행을 위한 연구를 진행했다. 강화 학습(RL)의 한계를 보완하기 위해 대규모 언어 모델(LLM)을 활용하는 방안을 모색했다. 특히, 소규모 LLM을 사용하여 RL의 보상 체계를 형성하는 하이브리드 접근 방식을 제안하고, RL-only, LLM-only, 하이브리드 방식을 비교 분석했다. 연구 결과, LLM 기반 접근 방식은 더 높은 성공률을 보일 수 있지만, 속도 저하 및 보수적인 경향을 나타냈다.