본 논문은 광산 운영 효율 향상을 위한 트럭 배차 일정 최적화 문제를 다룬다. 기존의 최적화 방법들은 광산 환경의 동적이고 확률적인 특성(장비 고장, 트럭 정비, 가변적인 운송 시간 등) 때문에 어려움을 겪는다. 강화학습(RL)은 이러한 문제에 대한 해결책으로 제시되었지만, 현실적이고 사용자 정의가 가능한 시뮬레이션 환경에서의 엄격한 평가가 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해, 광산 공정 최적화를 위한 구성 가능한 오픈소스 벤치마킹 환경인 Mining Gym을 제시한다. Mining Gym은 이산 사건 시뮬레이션(DES)을 기반으로 OpenAI Gym 인터페이스와 통합되어 있으며, 장비 고장, 대기열 정체, 광산 공정의 확률성 등을 모델링하여 현실적이고 적응적인 학습 환경을 제공한다. GUI, 데이터 로깅 시스템, KPI 대시보드, 실시간 시각화 기능을 통해 다양한 RL 전략과 기준 휴리스틱에 대한 표준화되고 재현 가능한 평가를 가능하게 한다.