본 논문에서는 저중력 환경(달, 화성, 소행성 등)에서의 탐사를 위해 다리 달린 로봇의 에너지 효율적인 제어 방식을 제시한다. 제한된 에너지 및 열 예산을 고려하여 중력 크기에 따라 조정된 에너지 최적화 보상 함수를 사용하는 강화 학습 기반 제어 방식을 제안하고, 달 중력(1.62 m/s²)부터 가상의 초지구 중력(19.62 m/s²)까지 다양한 중력 환경에서의 보행 제어 및 기본 자세 제어기를 개발하고 검증하였다. 지구 중력에서 15.65kg 로봇으로 0.4 m/s 속도에서 23.4W의 전력 소모를 달성하여 기준 정책 대비 23% 향상되었으며, 달 중력 실험에서는 기준 제어기보다 36% 적은 12.2W의 전력 소모를 달성하였다. 본 연구는 다양한 중력 수준에서 다리 달린 로봇을 위한 에너지 효율적인 보행 제어기를 개발하는 확장 가능한 접근 방식을 제공한다. 또한, 달 중력에서 실제 실험을 수행하기 위한 정력-보상 스프링 시스템을 설계하였다.