본 논문은 불확실한 환경에서 복잡한 시스템의 의사 결정을 최적화하는 강력한 프레임워크인 강화 학습(RL)을 소개합니다. 특히 에너지 전환의 맥락에서 중요한 문제입니다. 논문에서는 원격 마이크로그리드와 같은 시스템에서 풍력 터빈, 연료 발전기 및 배터리와 같은 재생 가능 에너지원을 조정하여 연료 소비 및 배터리 성능 저하를 최소화하면서 수요를 충족시키는 방법을 제시합니다. RL 에이전트가 이러한 제약을 준수하도록 보장하기 위해, 본 논문은 시스템 역학에 대한 사전 지식을 활용하여 제약 조건 만족을 보장하는 해석 가능한 접근 방식인 Shielded Controller Units (SCU)를 소개합니다. 원격 마이크로그리드 최적화 작업에서 SCU의 효과를 입증했으며, RL 에이전트는 연료 소비를 24% 줄이면서 모든 제약 조건을 충족하며 다른 기준선을 능가했습니다.