본 논문은 재생에너지원 통합 증가와 적응형 제어 전략 필요성으로 인해 점점 복잡해지는 전력망 운영에 대한 강화학습(Reinforcement Learning, RL) 기반의 전력망 제어(Power Network Control, PNC) 연구 동향을 종합적으로 분석한 설문조사 논문입니다. 특히, 전력망 운영 학습(Learning To Run a Power Network, L2RPN) 경진대회를 통해 표준화된 벤치마크와 문제 정의가 제공됨으로써 RL 기반 방법의 발전에 기여한 점을 언급하며, 기존 RL 기반 전력망 토폴로지 최적화 기술들을 체계적으로 분류하고 주요 설계 선택과 연구의 허점을 제시합니다. 나아가, 일반적으로 사용되는 RL 기반 방법들의 영향을 비교 분석하여 실질적 효과에 대한 통찰력을 제공하며, 향후 RL 기반 전력망 최적화 발전을 위한 기반을 마련하고자 합니다.