본 논문은 재생에너지원 통합 증가와 적응형 제어 전략 필요성으로 인해 점점 복잡해지는 전력망 운영에 대한 강화학습(RL) 기반 전력망 제어(PNC) 연구 동향을 종합적으로 분석합니다. 특히, L2RPN 경진대회를 통해 발전된 RL 기반 방법들을 전력망 토폴로지 최적화 관점에서 범주화하고 주요 설계 선택 및 연구의 한계점을 제시합니다. 여러 RL 기반 방법들의 비교 연구를 통해 실질적인 효과를 분석하고, 향후 연구 방향을 제시하여 RL 기반 전력망 최적화 발전에 기여하고자 합니다.