본 논문은 COVID-19 이후 인간 이동 제한과 병원 수용 능력 확보 사이의 균형을 효과적으로 유지하는 문제에 대한 해결책으로 다중 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL) 기반 접근 방식인 H2-MARL을 제안합니다. H2-MARL은 도시 규모에 관계없이 병원 수용 능력과 인간 이동성을 고려하여 파레토 최적점을 달성하는 것을 목표로 합니다. 읍면동 단위 감염 모델과 도시 전체 동적 시공간 전염병 시뮬레이터를 개발하고, 각 지역을 에이전트로 취급하는 MARL 프레임워크를 설계하여 이중 목표 보상 함수와 전문가 지식을 활용한 경험 재생 버퍼를 구축했습니다. 4개 도시의 10억 개 이상의 기록으로 구성된 읍면동 단위 인간 이동 데이터셋을 사용하여 광범위한 실험을 통해 H2-MARL이 병원 수용 능력 부담과 인간 이동 제한 손실을 최소화하는 최적의 이중 목표 절충 능력을 가지고 있으며, 다양한 규모의 도시에 적용 가능함을 검증했습니다.
시사점, 한계점
•
시사점:
◦
다양한 규모의 도시에서 병원 수용 능력과 인간 이동성 간의 균형을 효과적으로 제어하는 다중 에이전트 강화 학습 기반 모델을 제시.
◦
읍면동 단위의 세밀한 관리를 통해 보다 정교한 전염병 관리 전략 수립 가능성 제시.
◦
실제 도시 데이터를 활용한 실험을 통해 모델의 효과성 및 실용성 검증.
◦
파레토 최적화를 통해 이중 목표(병원 수용 능력 및 인간 이동 제한) 간의 최적의 절충점 도출.