본 논문은 자율주행 시스템(ADS)의 코드 생성 및 평가를 위한 프로토타입을 개발하고 평가한 연구 결과를 제시합니다. 자율주행 시스템의 복잡성과 지속적인 개선 필요성을 고려하여, 대규모 언어 모델(LLM)을 이용한 자동 코드 생성 및 평가 파이프라인을 구축하였습니다. 이 파이프라인은 LLM 기반 에이전트, 시뮬레이션 모델, 규칙 기반 피드백 생성기를 포함하며, LLM이 생성한 코드는 다양한 교통 시나리오에 대한 시뮬레이션을 통해 자동으로 평가되고, 그 결과는 LLM에 피드백으로 제공되어 코드 수정 및 버그 수정에 활용됩니다. Codellama:34b, DeepSeek (r1:32b 및 Coder:33b), CodeGemma:7b, Mistral:7b, GPT4 등의 LLM을 적용하여 ACC(Adaptive Cruise Control)와 CAEM(Unsupervised Collision Avoidance by Evasive Manoeuvre) 기능에 대한 코드 생성 및 평가를 수행하였으며, 두 OEM의 전문가 11명을 대상으로 인터뷰 연구를 통해 도구를 평가했습니다.