본 논문은 에너지 저장 관리에 대한 전통적인 방법과 강화 학습(RL) 방법 간의 절충점을 이해하고자 한다. 단순화된 마이크로그리드 모델(부하, 태양광 발전, 저장 장치 포함)을 기반으로, 이상적인 저장 장치(볼록 비용 함수), 손실이 있는 저장 장치, 손실이 있는 저장 장치와 볼록 전송 손실을 포함하는 세 가지 사용 사례를 점증적으로 복잡하게 하여 비교 분석한다. 전통적인 방법과 RL 방법의 성능을 비교하고 각 방법의 사용이 유리한 설정을 논의하며, 미래 연구 방향을 제시한다. 특히, 특정 사례에 대한 최적 제어 정책을 찾기 위해 전통적인 방법 대신 생성적 RL 정책을 사용할 때 발생하는 성능 저하를 분석한다.