본 논문은 클라우드 네이티브 시스템에서 Kubernetes 클러스터의 운영 복원력을 향상시키기 위한 다중 에이전트 기반 수평적 Pod 자동 확장(HPA) 시스템을 제안한다. 기존 HPA 방식의 한계를 극복하기 위해, 운영 복원력이라는 상위 목표를 여러 에이전트에게 위임된 특정 실패 상황별 하위 목표로 분해하는 다중 에이전트 시스템(MAS)을 설계한다. 이는 클러스터 추적 데이터를 기반으로 디지털 트윈을 구축하고, 시뮬레이션 환경에서 에이전트를 훈련시킨 후, 학습된 정책을 실제 클러스터에 적용하는 4단계 온라인 프레임워크를 통해 구현된다. 실험 결과, 제안된 HPA MAS는 다양한 적대적 상황에서 기존 HPA 시스템보다 우수한 운영 복원력을 유지하는 것으로 나타났다.