Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Heterogeneous Multi-Agent Proximal Policy Optimization for Power Distribution System Restoration

Created by
  • Haebom
Category
Empty

저자

Parya Dolatyabi, Mahdi Khodayar

개요

대규모 정전 후 전력 배전 시스템(PDS) 복구는 계통 토폴로지를 재구성하고 분산 에너지 자원(DER)을 조정하는 순차적 스위칭 작업을 필요로 합니다. 본 논문은 Heterogeneous-Agent Reinforcement Learning(HARL) 프레임워크, 특히 Heterogeneous-Agent Proximal Policy Optimization(HAPPO)를 적용하여 상호 연결된 마이크로그리드 간의 조정된 복구를 가능하게 합니다. 각 에이전트는 서로 다른 부하, DER 용량 및 스위치 수를 가진 개별 마이크로그리드를 제어하며, 분산형 액터 정책은 안정적인 온-정책 업데이트를 위해 중앙 집중식 비평가자를 사용하여 훈련됩니다. 물리학 기반 OpenDSS 환경은 완전한 전력 흐름 피드백을 제공하고, 무효한 액션 마스킹 대신 차별화 가능한 페널티 신호를 통해 작동 제한을 적용합니다. IEEE 123-bus 및 IEEE 8500-node 시스템에 대한 실험 결과 HAPPO가 DQN, PPO, MAES, MAGDPG, MADQN, Mean-Field RL 및 QMIX보다 빠른 수렴, 더 높은 복구 전력 및 더 부드러운 다중 시드 학습을 달성했습니다.

시사점, 한계점

HARL 프레임워크 내에 마이크로그리드 수준의 이질성을 통합하여 복잡한 PDS 복구를 위한 확장 가능하고 안정적이며 제약 조건을 고려한 솔루션을 제공함.
HAPPO는 기존 방법론보다 더 나은 성능을 보여줌.
물리학 기반 시뮬레이션 환경을 활용하여 실제 제약 조건을 효과적으로 반영.
총 DER 발전량 제한 및 지역 공급-수요 가능성 조건을 통해 시스템의 안정성을 확보.
논문에서 한계점에 대한 언급은 없음.
👍