Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Heterogeneous Multi-Agent Proximal Policy Optimization for Power Distribution System Restoration

Created by
  • Haebom
Category
Empty

저자

Parya Dolatyabi, Mahdi Khodayar

개요

대규모 정전 후 전력 배전 시스템(PDS) 복구를 위해, 서로 연결된 마이크로그리드에서 분산 에너지 자원(DER)을 조정하는 Heterogeneous-Agent Reinforcement Learning(HARL) 프레임워크를 적용했습니다. 특히, Heterogeneous-Agent Proximal Policy Optimization(HAPPO)를 사용하여 각기 다른 부하, DER 용량 및 스위치 수를 가진 개별 마이크로그리드를 제어하는 에이전트를 구성했습니다. 분산된 액터 정책은 중앙 집중식 비평가자를 통해 훈련되어 안정적인 정책 업데이트를 위한 이점 값을 계산합니다. OpenDSS 환경은 전력 흐름 피드백을 제공하고, 미분 가능한 페널티 신호를 통해 작동 제한을 적용합니다. IEEE 123-bus 및 IEEE 8500-node 시스템에서 HAPPO는 다른 강화 학습 알고리즘보다 더 빠른 수렴, 더 높은 복구 전력, 그리고 부드러운 다중 시드 훈련을 달성했습니다.

시사점, 한계점

HARL 프레임워크 내에서 마이크로그리드 수준의 이질성을 통합하여 복잡한 PDS 복구를 위한 확장 가능하고 안정적이며 제약 조건을 고려하는 솔루션을 제공함.
HAPPO는 DQN, PPO, MAES, MAGDPG, MADQN, Mean-Field RL 및 QMIX보다 더 나은 성능을 보임.
물리적 환경인 OpenDSS를 사용하여 실제적인 전력 흐름 시뮬레이션 및 작동 제한을 구현함.
총 DER 발전량은 2400kW로 제한되고, 각 마이크로그리드는 지역 공급-수요 가능성을 충족해야 함.
논문에서 구체적인 한계점은 명시되지 않음.
👍