본 논문은 광산 운영의 효율성을 높이기 위한 핵심 요소인 트럭 배차 스케줄링 최적화를 목표로, 강화 학습(RL) 알고리즘의 훈련, 테스트 및 평가를 위한 구성 가능한 오픈 소스 벤치마킹 환경인 Mining-Gym을 제시합니다. Salabim 기반의 이산 사건 시뮬레이션(DES)을 사용하여 구축되었으며, Gymnasium과 통합되어 광산 특정 불확실성을 포착합니다. 이 환경은 파라미터 구성, 데이터 로깅 및 실시간 시각화를 위한 GUI를 제공하며, RL 전략 및 휴리스틱 기반의 재현 가능한 평가를 지원합니다. Mining-Gym은 정상 작동부터 심각한 장비 고장에 이르기까지 6가지 시나리오에서 고전적인 휴리스틱과 RL 기반 스케줄링을 비교하여 검증되었으며, 적응형 의사 결정의 공정한 평가를 가능하게 하고 RL 훈련된 스케줄러의 강력한 성능 잠재력을 보여줍니다.