본 논문은 강화 학습 기반의 보행 로봇 제어 접근 방식을 제시하며, 중력 변화에 따른 에너지 효율적인 제어 방법 개발에 초점을 맞추고 있습니다. 특히, 달, 화성, 소행성과 같은 저중력 환경에서의 탐사를 목표로 하며, 중력 스케일링된 보상 함수를 사용하여 다양한 중력 환경에서 로봇의 보행 및 자세 제어를 수행합니다. 실험 결과, 제안된 방법은 지구 중력 환경에서 기존 방식 대비 23%의 전력 소비 감소를, 달 중력 환경에서는 36%의 전력 소비 감소를 달성했습니다.