본 논문은 대중교통 서비스 품질 평가를 위한 사용자 친화적인 챗봇을 제시한다. 대량의 데이터 분석이 필요한 대중교통 서비스 품질 평가 과정의 어려움을 해결하기 위해, LLM 기반 에이전트 아키텍처를 활용하여 SQL 쿼리 실행, 데이터 시각화, 지도 생성 등의 작업을 수행하는 챗봇을 개발하였다. 또한, 생성 AI 시스템 성능 측정을 위한 데이터 수집 방법론을 제시하고, 챗봇의 응답 일관성과 쿼리 정확성 평가를 위한 데이터셋을 구축하는 과정을 설명한다.