Sign In

Multi-Agent Reinforcement Learning with Long-Term Performance Objectives for Service Workforce Optimization

Created by
  • Haebom
Category
Empty

저자

Kareem Eissa, Rayal Prasad, Sarith Mohan, Ankur Kapoor, Dorin Comaniciu, Vivek Singh

개요

본 논문은 여러 행정 및 시간 척도에 걸쳐 의사결정이 이루어지는 효율적인 조직 운영에서 중요한 역할을 하는 인력 최적화 문제를 다룹니다. 기존 연구는 자원 할당 및 시설 위치 지정과 같은 하위 문제에 초점을 맞춰 지역 탐색 및 최근에는 심층 강화 학습과 같은 휴리스틱 기법으로 해결해 왔지만, 이러한 하위 문제들이 완전히 독립적이지 않은 현실 세계 시나리오를 정확하게 반영하지 못할 수 있습니다. 본 연구는 통합된 인력 최적화 문제를 모델링하는 시뮬레이터를 생성하여 이러한 간극을 메우는 것을 목표로 합니다. 특히, 통합 인력 최적화 문제에 대한 강화 학습 방법 개발을 지원하는 모듈식 시뮬레이터를 설계하고, 인력 배치, 인력 관리, 인력 위치 선정이라는 세 가지 상호 의존적인 측면에 중점을 둡니다. 이 시뮬레이터는 다양한 수준의 확률성과 비정상성을 가진 동적 시나리오를 탐색할 수 있도록 구성 가능한 매개변수를 제공하며, 벤치마킹 및 에이블레이션 연구를 용이하게 하기 위해 위에서 언급한 측면에 대한 휴리스틱 및 RL 기준도 포함합니다.

시사점, 한계점

시사점:
통합된 인력 최적화 문제를 위한 모듈식 시뮬레이터를 제공하여 강화학습 기반의 연구를 용이하게 함.
인력 배치, 관리, 위치 선정 등 상호 의존적인 측면을 통합적으로 고려.
다양한 수준의 확률성과 비정상성을 가진 동적 시나리오 탐색 가능.
휴리스틱 및 RL 기준 제공으로 벤치마킹 및 에이블레이션 연구 지원.
한계점:
제시된 시뮬레이터의 실제 현장 적용 및 성능에 대한 검증 부족.
시뮬레이터의 모듈성 및 확장성에 대한 추가적인 검토 필요.
다양한 유형의 인력 및 작업 환경에 대한 일반화 가능성에 대한 추가 연구 필요.
👍