본 논문은 복잡한 동역학 시스템의 불안정성 제어 문제를 다룬다. 심층 강화 학습(DRL)의 유용성을 제시하지만, 실제 환경과의 상호작용이 많이 필요하고, 복잡한 동역학의 경우 실험 데이터 수집이나 시뮬레이션이 어렵다는 한계점을 지적한다. 이를 해결하기 위해, 물리 기반 하이브리드 모델을 제한적인 고충실도 데이터로 보정하는 다중 충실도 강화 학습(MFRL) 프레임워크를 제안한다. 또한, 스펙트럼 기반 보상 함수를 제안하고, 두 가지 복잡한 물리적 동역학 시스템에 대한 제어 실험을 통해 제안된 프레임워크의 효과를 검증한다. MFRL 제어 결과의 통계는 고충실도 환경의 다중 쿼리 평가 결과와 일치하며, 기존 최고 성능(SOTA) 기준 모델보다 우수한 성능을 보였다.