본 논문은 여러 행정 및 시간 척도에 걸쳐 의사결정이 이루어지는 효율적인 조직 운영에서 중요한 역할을 하는 인력 최적화 문제를 다룹니다. 기존 연구는 자원 할당 및 시설 위치 지정과 같은 하위 문제에 초점을 맞춰 지역 탐색 및 최근에는 심층 강화 학습과 같은 휴리스틱 기법으로 해결해 왔지만, 이러한 하위 문제들이 완전히 독립적이지 않은 현실 세계 시나리오를 정확하게 반영하지 못할 수 있습니다. 본 연구는 통합된 인력 최적화 문제를 모델링하는 시뮬레이터를 생성하여 이러한 간극을 메우는 것을 목표로 합니다. 특히, 통합 인력 최적화 문제에 대한 강화 학습 방법 개발을 지원하는 모듈식 시뮬레이터를 설계하고, 인력 배치, 인력 관리, 인력 위치 선정이라는 세 가지 상호 의존적인 측면에 중점을 둡니다. 이 시뮬레이터는 다양한 수준의 확률성과 비정상성을 가진 동적 시나리오를 탐색할 수 있도록 구성 가능한 매개변수를 제공하며, 벤치마킹 및 에이블레이션 연구를 용이하게 하기 위해 위에서 언급한 측면에 대한 휴리스틱 및 RL 기준도 포함합니다.